ชุดเครื่องมือและคลังการประมวลภาษาธรรมชาติแบบควอนตัม

“lambeq” เปลี่ยนประโยคให้เป็นวงจรควอนตัม เร่งการพัฒนาแอปพลิเคชัน QNLP ที่ใช้งานได้จริง เมื่อระบบควอนตัมคอมพิวติ้งขยายตัว

Cambridge Quantum (“CQ”) ประกาศเปิดตัวชุดเครื่องมือและคลังการประมวลภาษาธรรมชาติแบบควอนตัม (QNLP) เป็นครั้งแรกของโลกในชื่อว่า “lambeq” ซึ่งตั้งขึ้นตามชื่อของนักคณิตศาสตร์และนักภาษาศาสตร์ผู้ล่วงลับอย่าง Joachim Lambek

lambeq เป็นชุดเครื่องมือซอฟต์แวร์ QNLP ตัวแรกของโลก ที่รองรับการแปลงประโยคให้เป็นวงจรควอนตัม โดยได้รับการออกแบบเพื่อเร่งการพัฒนาแอปพลิเคชัน QNLP ที่นำไปใช้งานได้ในโลกจริง เช่น การสนทนาอัตโนมัติ การทำเหมืองข้อความ การแปลภาษา แปลงข้อความเป็นเสียงพูด การสร้างภาษา และชีวสารสนเทศ

lambeq เปิดตัวแบบโอเพนซอร์ซเต็มรูปแบบ เพื่อเป็นประโยชน์ต่อแวดวงควอนตัมคอมพิวติ้งทั่วโลก เช่นเดียวกับกลุ่มนักวิจัย นักพัฒนา และผู้ใช้ในแวดวงควอนตัมคอมพิวติ้งที่มีจำนวนมากขึ้นอย่างรวดเร็ว lambeq ทำงานอย่างแนบเนียนกับ TKET ของ CQ ซึ่งเป็นแพลตฟอร์มพัฒนาซอฟต์แวร์ควอนตัมระดับแถวหน้าและเติบโตเร็วที่สุดในโลกซึ่งอยู่ในลักษณะโอเพนซอร์ซเต็มรูปแบบด้วยเช่นกัน เพื่อเปิดโอกาสให้นักพัฒนา QNLP เข้าถึงควอนตัมคอมพิวเตอร์ได้มากที่สุดเท่าที่เป็นไปได้

lambeq ได้รับการคิดค้น ออกแบบ และกำหนดโครงสร้างโดยทีมวิจัยควอนตัมคอมพิวติ้งในออกซ์ฟอร์ดของ CQ ซึ่งนำโดยหัวหน้านักวิทยาศาสตร์อย่าง Bob Coecke โดยมีนักวิทยาศาสตร์อาวุโสอย่าง ดร. Dimitrios Kartsaklis เป็นหัวหน้าสถาปนิกประจำแพลตฟอร์ม ทั้งนี้ lambeq และ QNLP เป็นผลจากโครงการวิจัยที่ใช้เวลามากว่าทศวรรษ

“ทีมงานของเราได้เข้าไปมีบทบาทในการวางรากฐาน ซึ่งสำรวจหาแนวทางในการใช้ควอนตัมคอมพิวเตอร์เพื่อแก้ไขปัญหาที่ยุ่งยากเป็นอันดับต้น ๆ ในเรื่องปัญญาประดิษฐ์” คุณ Coecke กล่าว “ผลงานของเรามาจากความก้าวหน้าที่ผมได้บุกเบิกไว้กับคุณ Steve Clark ซึ่งปัจจุบันเป็นหัวหน้าฝ่าย AI ของ CQ และทีมงานท่านอื่น ๆ NLP อยู่ในใจกลางของการสำรวจเหล่านี้ การเปิดตัว lambeq เป็นสิ่งที่ต้องเกิดขึ้นอยู่แล้ว หลังจากที่เมื่อไม่กี่เดือนที่ผ่านมาได้มีการเผยแพร่รายละเอียดเกี่ยวกับการที่ CQ นำ QNLP ไปใช้เป็นครั้งแรกของโลกกับควอนตัมคอมพิวเตอร์จริง ๆ รวมถึงการเปิดเผยหลักการพื้นฐานเบื้องต้นเมื่อเดือนธันวาคม 2562”

“ในรายงานหลายฉบับที่เผยแพร่ตลอดปีที่ผ่านมานั้น” คุณ Coecke กล่าวเสริม “เราไม่ได้ให้รายละเอียดเกี่ยวกับการใช้ควอนตัมคอมพิวเตอร์ยกระดับ NLP เพียงเท่านั้น แต่ยังแสดงให้เห็นว่า QNLP มีความเป็น ‘quantum native’ ด้วย ซึ่งหมายความว่า โครงสร้างองค์ประกอบของภาษานั้นมีลักษณะทางคณิตศาสตร์เหมือนกับโครงสร้างของระบบควอนตัม สิ่งนี้จะทำให้โลกก้าวออกจากกระบวนทัศน์ที่มีอยู่ปัจจุบันในเรื่องของ AI ซึ่งอาศัยเทคนิคแบบบรู๊ทฟอร์ชที่ทั้งคลุมเครือและไม่แน่นอน”

lambeq ทำให้ออกแบบและดำเนินการทดลอง NLP แบบ compositional-distributional (DisCo) ตามที่นักวิทยาศาสตร์ของ CQ เคยอธิบายไว้ได้อย่างอัตโนมัติ ทำให้ก้าวออกจากการใช้แผนผังแบบ syntax/grammar ซึ่งเป็นตัวเข้ารหัสโครงสร้างของข้อความ ไปสู่การใช้เครือข่ายเทนเซอร์ (แบบดั้งเดิม) หรือไม่ก็วงจรควอนตัมที่ดำเนินการกับ TKET พร้อมนำไปปรับใช้ให้รองรับกับการทำงานที่ใช้แมชชีนเลิร์นนิง เช่น การจำแนกข้อความ lambeq มีการออกแบบแยกเป็นส่วน ๆ เพื่อให้ผู้ใช้เปลี่ยนองค์ประกอบต่าง ๆ เข้าออกได้ และมีความยืดหยุ่นในการออกแบบทางสถาปัตยกรรมด้วย

lambeq กำจัดอุปสรรคในการเข้าถึงสำหรับผู้ปฏิบัติและนักวิจัยที่ให้ความสนใจกับ AI และการสื่อสารระหว่างมนุษย์กับเครื่องจักร ซึ่งอาจเป็นแนวทางสำคัญอันดับต้น ๆ ในการนำเทคโนโลยีควอนตัมไปใช้ โดย TKET มีฐานผู้ใช้งานทั่วโลกเป็นหลักแสน ขณะที่ lambeq มีศักยภาพในการเป็นชุดเครื่องมือที่สำคัญที่สุดสำหรับแวดวงควอนตัมคอมพิวติ้งที่ต้องการศึกษาการใช้เทคโนโลยี QNLP ที่นับเป็นตลาดที่สำคัญอันดับต้น ๆ สำหรับวงการ AI นอกจากนี้ จุดสำคัญอย่างหนึ่งที่ปรากฏให้เห็นชัดเจนเมื่อไม่นานมานี้คือ QNLP ยังนำไปใช้วิเคราะห์ลำดับสัญลักษณ์ทางจีโนมิกส์และโปรตีโอมิกส์ได้ด้วย

Merck Group ซึ่งเป็นพันธมิตรที่ร่วมเปิดตัวและนำ lambeq ไปใช้เป็นรายแรก ๆ นั้น ได้เผยแพร่รายงานวิจัยเกี่ยวกับ QNLP เมื่อไม่นานมานี้ โดยเป็นส่วนหนึ่งของโครงการที่ทำกับ Quantum Entrepreneurship Laboratory จาก Technical University of Munich

Thomas Ehmer จากฝ่าย IT Healthcare Innovation Incubator ของ Merck และผู้ร่วมก่อตั้ง Quantum Computing Interest Group กล่าวว่า “การใช้คุณสมบัติเด่นของควอนตัมคอมพิวติ้งในการพัฒนาการค้นพบสำคัญเป็นส่วนสำคัญของการวิจัยของเราที่ Merck โดยโครงการด้าน QNLP ที่เราเพิ่งเปิดเผยเมื่อไม่นานมานี้กับนักวิจัยจาก TU Munich ได้พิสูจน์ให้เห็นว่า การใช้เทคนิค QNLP ในการจำแนกประโยคแบบไบนารี ให้ผลลัพธ์ที่เทียบได้กับกลวิธีดั้งเดิมแม้จะเพิ่งอยู่ในขั้นนี้ก็ตาม โดยเห็นได้ชัดว่า โครงสร้างควอนตัมคอมพิวติ้งพื้นฐานนี้จำเป็นต้องก้าวหน้าก่อนที่เทคนิคเหล่านี้จะมีการนำไปใช้ในเชิงการค้า และที่สำคัญยิ่ง เราได้เห็นแนวทางในการนำ QNLP เหล่านี้ไปใช้ เพื่อกรุยทางสู่ Explainable AI และก่อให้เกิดความชาญฉลาดที่ถูกต้องแม่นยำยิ่งขึ้นและอธิบายได้ด้วย ซึ่งเป็นหัวใจสำคัญในแวดวงการแพทย์”

“QNLP มีผลงานทางทฤษฎีน่าสนใจมากมาย แต่ทฤษฎีก็มักจะอยู่ห่างจากการปฏิบัติจริงอยู่มาก” คุณ Kartsaklis กล่าว “lambeq เปิดโอกาสให้นักวิจัยได้เข้ามาสัมผัสกับการทดลองใช้ QNLP ด้วยตนเอง ซึ่งทุกวันนี้ยังคงเป็นขอบข่ายที่ยังไม่มีการสำรวจทั่วถึง นับเป็นความก้าวหน้าสำคัญในการทำให้การนำ NLP ไปใช้กับฮาร์ดแวร์ควอนตัมเป็นความจริง”

lambeq เปิดตัวในรูปแบบคลัง Python ทั่วไปบน GitHub ที่ https://github.com/CQCL/lambeq โดยวงจรควอนตัมที่ lambeq สร้างขึ้นนั้นได้มีการนำไปใช้งานกับควอนตัมคอมพิวเตอร์ของ IBM และอุปกรณ์ซีรีส์ H ของ Honeywell Quantum Solutions

ชุดเครื่องมือดังกล่าวได้รับการนำเสนอในรายงานทางเทคนิคที่อัปโหลดบน arxiv โดยอ่านได้ที่ https://arxiv.org/abs/2110.04236 และยังมีให้อ่านในบล็อก https://medium.com/cambridge-quantum-computing/quantum-natural-language-processing-ii-6b6a44b319b2 โดยติดต่อสอบถามข้อมูลทางเทคนิคได้ที่ lambeq-support@cambridgequantum.com

ในช่วงไม่กี่ปีที่ผ่านมานี้ NLP มีการใช้งานแพร่หลายมากขึ้นในภาคส่วนต่าง ๆ ทั่วโลก ไม่ว่าจะเป็นงานบริการลูกค้า เทคโนโลยีผู้บริโภค ไปจนถึงการดูแลสุขภาพและโฆษณา โดยรายงานวิเคราะห์ภาคอุตสาหกรรมคาดการณ์ว่า ตลาด NLP ระดับโลกน่าจะมีมูลค่ามากถึง 1.2726 แสนล้านดอลลาร์ภายในปี 2571 ด้วยอัตรา CAGR เกือบ 30%[1]

เกี่ยวกับ Cambridge Quantum

CQ ก่อตั้งขึ้นในปี 2557 และได้รับการสนับสนุนจากบริษัทควอนตัมคอมพิวติ้งชั้นนำระดับโลกหลายแห่ง CQ เป็นผู้นำระดับโลกด้านซอฟต์แวร์ควอนตัมและอัลกอริทึมควอนตัมที่ช่วยให้ลูกค้าได้รับประโยชน์สูงสุดจากฮาร์ดแวร์ควอนตัมคอมพิวติ้งที่พัฒนาอย่างรวดเร็ว ทั้งนี้ CQ มีสำนักงานในยุโรป สหรัฐอเมริกา และญี่ปุ่น เมื่อวันที่ 8 มิถุนายน 2564 CQ ได้ประกาศควบรวมกิจการกับ Honeywell Quantum Solutions ซึ่งคาดว่าจะสามารถปิดดีลได้ในไตรมาส 4 ปี 2564

ดูข้อมูลเพิ่มเติมได้ที่ http://www.cambridgequantum.com และ LinkedIn ตลอดจนเข้าถึงซอร์สโค้ด lambeq, TKET, Python และอื่น ๆ ได้ที่ GitHub

[1] https://www.fortunebusinessinsights.com/industry-reports/natural-language-processing-nlp-market-101933