AI เตรียมพร้อมสำหรับการวิเคราะห์ข้อมูล: ใช้ประโยชน์สูงสุดจากการเรียนรู้ของเครื่อง

AI เตรียมพร้อมสำหรับการวิเคราะห์ข้อมูล: ใช้ประโยชน์สูงสุดจากการเรียนรู้ของเครื่อง

ปัจจัยสำคัญคือผลกระทบของขนาด โดยเฉพาะอย่างยิ่งการเติบโตแบบคู่ขนานของข้อมูลและพลังการประมวลผลที่มีอยู่ และสิ่งนี้ได้เปลี่ยนความสามารถของเทคนิคหนึ่งโดยเฉพาะอย่างยิ่ง  การเรียนรู้เชิงลึก  ซึ่งได้รับประโยชน์อย่างมากจากความพร้อมใช้งานของชุดข้อมูลขนาดใหญ่ ในขณะที่วิธีการอื่นๆ ทำได้ช้าเมื่อคุณป้อนข้อมูลเพิ่มเติมให้กับพวกเขา ประสิทธิภาพของโครงข่ายประสาทเทียมของการเรียนรู้

เชิงลึก

ยังคงเพิ่มสูงขึ้นอย่างต่อเนื่อง และยิ่งโครงข่ายประสาทเทียมมีขนาดใหญ่ (หรือลึกกว่านั้น) ความสามารถในการดูดซับค่าของอินพุตและเอาต์พุตที่มีความหมายก็จะยิ่งมากขึ้นเท่านั้น การรวมข้อมูลขนาดใหญ่เข้ากับการประมวลผลจำนวนมากทำให้สามารถสร้างเครือข่ายประสาทเทียมที่มีเลเยอร์ซ่อนอยู่มากมาย 

ระบบการเรียนรู้เชิงลึกเหล่านี้เป็นฟังก์ชันทางคณิตศาสตร์ขนาดใหญ่ที่ประกอบด้วยโหนดหลายชั้น พร้อมน้ำหนักและอคติที่ปรับได้เอง ทั้งหมดนี้ประกบระหว่างชุดอินพุตและเอาต์พุต การรวมกันของข้อมูลและการคำนวณที่เข้มข้น ร่วมกับความเข้าใจที่มากขึ้นเกี่ยวกับวิธีการฝึกฝน (หรือเผยแพร่) 

เครือข่ายหลายชั้นที่ทรงพลังเหล่านี้ กำลังยกระดับประสิทธิภาพของเทคนิคการเรียนรู้ของเครื่องให้สูงขึ้นไปอีกขั้น มีส่วนร่วมกับผลประโยชน์ในทางกลับกัน กลุ่มวิจัยต้องการการเข้าถึงข้อมูลจำนวนมากและการประมวลผลจำนวนมากเพื่อใช้ประโยชน์อย่างเต็มที่จากการเรียนรู้เชิงลึก และพวกเขาต้องการ

การสนับสนุนจากทีมที่สามารถทำให้ระบบเหล่านี้ทำงานได้ เป็นปัญหา หัวหน้านักวิทยาศาสตร์ข้อมูล และทีมของเขาทราบดี เพื่อช่วยให้นักวิจัยดึงข้อมูลวิทยาศาสตร์จากการทดลองได้มากขึ้นและมีประสิทธิภาพมากขึ้น กำลังรวบรวมกลุ่ม ซึ่งทำงานอย่างใกล้ชิดกับซึ่งเป็นสถาบันแห่งชาติ

ด้านวิทยาศาสตร์ข้อมูลและปัญญาประดิษฐ์ ยังเชื่อมโยงกับ ซึ่งกำลังจัดตั้งขึ้นเพื่อเป็นศูนย์กลางวิทยาศาสตร์แบบบูรณาการ ข้ามสาขาวิชา และเน้นข้อมูล ซึ่งมีศักยภาพในการเปลี่ยนแปลงการวิจัยในศูนย์วิทยาศาสตร์ขนาดใหญ่ผ่านแนวทางสหสาขาวิชาชีพในการประมวลผลข้อมูล การจำลองด้วย

คอมพิวเตอร์

และข้อมูล การวิเคราะห์ วัตถุประสงค์ของ Hey รวมถึงการนำ AI และเทคโนโลยีแมชชีนเลิร์นนิงขั้นสูงไปใช้กับข้อมูลการทดลองที่สร้างโดยสิ่งอำนวยความสะดวกที่สนับสนุนแหล่งกำเนิดไดมอนด์ซินโครตรอน แหล่งกำเนิดนิวตรอนและมิวออนของ ISIS; ศูนย์เลเซอร์กลางของสหราชอาณาจักร; และศูนย์ 

สำหรับการวิเคราะห์ข้อมูลสิ่งแวดล้อมพร้อมคลัสเตอร์ข้อมูลระดับสูง“การวิเคราะห์ชุดข้อมูลขนาดใหญ่ต้องการระบบอัตโนมัติและความช่วยเหลือจากเครื่องจักร เนื่องจากปริมาณมากเกินกว่าที่เคยทำได้ด้วยมือ” เฮ้ให้ความเห็น “อย่างไรก็ตาม มีโอกาสมากมายที่จะช่วยทำให้การไหลของข้อมูลในไปป์ไลน์

เป็นไปโดยอัตโนมัติในการรับข้อมูลจากเครื่องจักรไปยังจุดที่คุณสามารถทำวิทยาศาสตร์ด้วยผลลัพธ์ที่ได้” การสร้างไปป์ไลน์นี้จำเป็นต้องช่วยให้นักวิจัยเข้าใจมากขึ้นเกี่ยวกับอัลกอริทึมการเรียนรู้ของเครื่อง “คุณต้องการความโปร่งใสและความเข้าใจว่าวิธีการต่างๆ จะช่วยให้คุณได้รับคำตอบได้อย่างไร 

ไม่ใช่กล่องดำ” เขาชี้ให้เห็น เฮ้กระตือรือร้นที่จะพัฒนาสิ่งที่เขาอธิบายว่าเป็นการวัดประสิทธิภาพการเรียนรู้ของเครื่อง นอกจากนี้ เขายังต้องการใช้ความเชี่ยวชาญที่มีอยู่ในชุมชน เช่น ฟิสิกส์ของอนุภาคและดาราศาสตร์ ซึ่งได้รับมือกับความท้าทายด้านข้อมูลขนาดใหญ่ระดับเพตะไบต์มาระยะหนึ่งแล้ว 

เป้าหมายคือการสร้างโครงสร้างการสนับสนุนที่กว้างขึ้นสำหรับแมชชีนเลิร์นนิงและ AI ที่สาขาอื่นๆ สามารถนำไปใช้ได้ ซึ่งหมายถึงความสามารถในการแยกศัพท์แสงออกและทำให้กระบวนการต่างๆ เช่น แบบจำลองการจัดประเภทข้อมูลสามารถเข้าใจได้นอกฟิลด์ที่กำหนด

ห้องปฏิบัติการสอนวิธีหนึ่งในการลดอุปสรรคในการเข้าถึงคือการจัดเตรียมสิ่งที่เรียกว่า “ห้องทดลองสำหรับการสอน” ตัวอย่างเช่น รูทีน C++ ที่บรรจุไว้ในไลบรารี R แต่งงานกับชุดข้อมูล แล้วรวมไว้ในเว็บ แอพ เพื่อการเข้าถึงที่สะดวก “พวกเขาให้คนดูอัลกอริทึมต่างๆ และเล่นกับพวกเขาเพื่อเรียนรู้ลักษณะ

เฉพาะ

ของพวกเขา และค้นพบว่าวิธีการต่างๆ อาจมีประโยชน์หรือไม่มีประโยชน์ในการทำงานของพวกเขาได้อย่างไร” เขากล่าวสำหรับวัตคินส์และเพื่อนร่วมงานด้านวิทยาศาสตร์สิ่งแวดล้อม ขนาดเดียวแทบไม่เหมาะกับทุกคน นักวิจัยในสาขานี้มักจำเป็นต้องเข้าใจข้อมูลที่หลากหลายจากแหล่งต่างๆ 

“ตามหลักการแล้ว คุณต้องการเข้าถึงเครื่องมือต่างๆ เพื่อเข้าถึงกลุ่มข้อมูลและเปรียบเทียบผลลัพธ์เพื่อหาวิธีการที่มีประสิทธิภาพสูงสุด” เขาแนะนำ “คุณไม่ต้องการอยู่ในตำแหน่งที่คุณสามารถโจมตีได้ด้วยวิธีเดียว เพราะนั่นคือความสามารถเดียวที่คุณมี” มีข้อควรพิจารณาอื่น ๆ ด้วยเช่นกัน นอกเหนือจากการใช้

ศัพท์แสงและจัดหาเครื่องมือที่เข้าถึงได้และเป็นเกณฑ์มาตรฐาน สิ่งสำคัญคือต้องสนับสนุนเวิร์กโฟลว์ที่เหมาะสมที่สุดสำหรับงานหนึ่งๆ ซึ่งอาจเรียกใช้โมเดลบน HPC จัดเก็บผลลัพธ์ในคลัสเตอร์ข้อมูลขนาดใหญ่ จากนั้นจึงเปลี่ยนไปใช้การดำเนินการในสเกลที่เล็กลงเมื่อข้อมูลส่วนที่สำคัญมี ได้รับการระบุ

เห็นได้ชัดว่ามันเป็นงานสำหรับทีมที่มีทักษะหลากหลายซึ่งไม่เพียงสามารถนำทางเทคโนโลยีเท่านั้น แต่ยังรวมถึงวิทยาศาสตร์ที่ AI กำหนดเป้าหมายด้วย ย้อนกลับไปที่ตัวอย่างก่อนหน้านี้ Draper ได้รับการสนับสนุนโดยการวิเคราะห์นำร่องโดยใช้ข้อมูลการกระเจิงของนิวตรอนมุมเล็ก ซึ่งตอนนี้ AI กำลังถูกใช้

เพื่อชี้นำผู้ใช้ไปสู่การใช้แบบจำลองทรงกลมหรือแบบจำลองทรงกระบอกเพื่อให้พอดีกับข้อมูล ผลลัพธ์ในระยะเริ่มต้นมีแนวโน้มดี แต่คำถามต่อไปคือวิธีการยังคงมีประสิทธิภาพหรือไม่เมื่อตัวเลือกข้ามไปยังแบบจำลองต่างๆ มากถึง 40 แบบ แค่จุดเริ่มต้นและเพื่อนร่วมงาน  เชื่อว่านี่เป็นเพียงจุดเริ่มต้น

credit : เว็บแท้ / ดัมมี่ออนไลน์