Google ดัน AI ลง Android และ Chrome ช่วยยกระดับการเข้าถึง

หนังสือพิมพ์โพสต์ทูเดย์ออนไลน์

Google บริษัทเทคโนโลยียักษ์ใหญ่ประกาศเปิดตัวฟีเจอร์ AI ใหม่ ให้กับระบบปฏิบัติการ Android และ Chrome โดยการนำเอา Gemini เข้ามาช่วยสนับสนุนการทำงาน ช่วยอธิบายรายละเอียดบนหน้าจอ เพิ่มระดับตรวจจับเสียงพูด ไปจนการเข้าถึงและใช้งานไฟล์ PDF ที่สะดวกยิ่งขึ้น

แรกสุดคือการนำฟีเจอร์ TalkBack ที่ใช้บรรยายสิ่งที่อยู่บนหน้าจอมาประมวลผลด้วย Gemini ช่วยให้ระบบสามารถตอบคำถามเกี่ยวกับเนื้อ ภาพ หรือรายละเอียดบนหน้าจอได้โดยตรง เช่น คำถามเกี่ยวกับกีตาร์ที่อาจระบุสี่ ยี่ห้อ และราคาได้ผ่านเสียง เป็นประโยชน์อย่างยิ่งในการสนับสนุนการใช้งานของผู้พิการทางสายตา

อันดับถัดมาคือการอัปเดต Expressive Captions ฟีเจอร์สร้างคำบรรยายอัตโนมัติ ที่จะช่วยตรวจจับสิ่งที่พูดให้ออกมาเป็นคำบรรยายแบบเรียลไทม์ เพิ่มความสะดวกในการติดตามและทบทวนเนื้อหาทีรับฟัง อย่างไรก็ตามฟีเจอร์นี้อาจมีการคลาดเคลื่อนจากการเล่นเสียงจนทำให้เนื้อความคลาดเคลื่อน

ล่าสุดพวกเขานำ Gemini เข้ามาสนับสนุนระบบนี้เต็มรูปแบบ ช่วยให้สามารถเก็บรายละเอียดและเรียนรู้เนื้อหาเสียงได้แม่นยำยิ่งขึ้น เช่น การลากเสียงยาวระหว่างเกมโชว์หรือการแข่งขันกีฬาที่ไม่เกิดการสับสนอีกต่อไป พร้อมระบุรายละเอียดเสียงรบกวนแทรกซ้อน เช่น เสียงนกหวีด เสียงเฮ หรือเสียงกระแอมต่างๆ

สำหรับ Chrome ฟีเจอร์ที่ได้รับการพัฒนาขึ้นมาคือ การใช้งาน AI ช่วยให้เข้าถึงเนื้อหา PDF ได้อาศัยระบบ Optical Character Recognition (OCR) ในการจดจำเนื้อหาแล้วแปลงเป็นข้อความ เพื่อให้ผู้ใช้งานสะดวกต่อการนำไปต่อยอดใช้งานทั้งในการค้นหา คัดลอก ไปจนแก้ไขเนื้อหาต่อไป

รายละเอียดเพิ่มเติม : https://www.posttoday.com/ai-today/724107

ฟีเจอร์ใหม่ของ Android จะเริ่มให้ใช้งานในสหรัฐฯ สหราชอาณาจักร แคนานา และออสเตรเลียก่อน ส่วน Chrome คาดว่าจะเปิดให้เข้าถึงในไม่ช้า

https://www.posttoday.com/ai-today/724107