Apple, NVIDIA, Salesforce และอีกหลายคนถูกกล่าวหาว่าคัดลอกวิดีโอ YouTube เพื่อฝึกโมเดล AI

การสืบสวนพบว่ายักษ์ใหญ่ด้านเทคโนโลยีได้รวบรวมข้อมูลจากวิดีโอ YouTube มากกว่า 170,000 รายการจากช่องมากกว่า 48,000 ช่องที่ไม่เกี่ยวข้องกับบริษัท

เนื่องจากแนวปฏิบัติที่เป็นที่ถกเถียงกันในการพัฒนา การใช้งาน และการบำรุงรักษาปัญญาประดิษฐ์ยังคงเป็นประเด็นร้อน การสืบสวนเมื่อเร็ว ๆ นี้จึงอาจเผยให้เห็นการใช้วิดีโอ YouTube โดยรวมและไม่ได้รับการอนุมัติในการฝึกอบรมโมเดล AI ที่ Apple, NVIDIA, Salesforce และยักษ์ใหญ่ด้านเทคโนโลยีอื่น ๆ . การสืบสวนชี้ให้เห็นว่าช่อง YouTube ของบุคคลที่สามจำนวนมากและเนื้อหาอาจถูกคัดลอกโดยผู้รวบรวมข้อมูลและนำไปใช้โดยไม่ได้รับการอนุมัติในการฝึกอบรม AI

การสอบสวนครั้งใหญ่ดำเนินการโดย Proof News ตามที่รายงานโดยแบบมีสาย- การตรวจสอบพิจารณาเนื้อหาและชุดข้อมูลที่ใช้ในการฝึกอบรมโมเดล AI ซึ่งรวมถึงคำบรรยายและการถอดเสียงที่คัดลอกมาจากวิดีโอ YouTube ประมาณ 173,536 รายการ ซึ่งเป็นตัวแทนของช่องต่างๆ มากกว่า 48,000 ช่อง กล่าวกันว่าข้อมูลนี้ถูกใช้โดยบริษัทยักษ์ใหญ่ด้านเทคโนโลยีจำนวนหนึ่ง รวมถึง Apple, NVIDIA, Salesforce และ Anthropic

Apple ได้รวบรวมข้อมูลสำหรับ AI จากหลายบริษัท

หนึ่งในนั้นได้คัดลอกข้อมูล/การถอดเสียงจำนวนมากจากวิดีโอ YouTube รวมถึงของฉันด้วย

ในทางเทคนิคแล้ว Apple หลีกเลี่ยง "ข้อผิดพลาด" ที่นี่เพราะไม่ใช่สิ่งที่ขูด

แต่นี่จะเป็นปัญหาที่พัฒนาไปอีกนานhttps://t.co/U93riaeSlY

— มาร์ค บราวน์ลี (@MKBHD)16 กรกฎาคม 2024

แหล่งที่มาของข้อมูลดังกล่าวที่ใช้ในชุดข้อมูล "คำบรรยายของ YouTube" นี้มีเนื้อหาจากช่องทางการศึกษาและข้อมูลต่างๆ เช่น MIT และ Harvard กลุ่มสื่อข่าว เช่น BBC และ Wall Street Journal และแม้แต่แหล่งบันเทิง เช่น The Late Show With Stephen Colbert และ Last Week Tonight กับ John Oliver ผู้สร้างเนื้อหา YouTube จำนวนมาก เช่น MrBeast, Jacksepticeye และ PewDiePie ก็ปรากฏอย่างเด่นชัดในชุดข้อมูลเช่นกัน ผู้สร้างเช่นมาร์กส์ บราวน์ลีของ MKBHD Podcast เล่าว่าพวกเขาไม่เคยอนุญาตให้ใช้วิดีโอของตนในลักษณะดังกล่าว แต่เนื้อหาของพวกเขาก็ยังถูกใช้อยู่

เนื่องจากยักษ์ใหญ่ด้านเทคโนโลยีไล่ล่าข้อมูลใด ๆ ที่พวกเขาได้รับเพื่อใช้การฝึกอบรม AI อย่างไม่ลดละ จะต้องติดตามดูต่อไปหากเสียงโวยวายดังกล่าวกระตุ้นให้เกิดการปรับเปลี่ยนหรือหยุดการคัดลอกข้อมูลของวิดีโอที่ไม่ผ่านการอนุมัติ คอยติดตามในขณะที่เราดูการอัปเดตเพิ่มเติมเกี่ยวกับเรื่องนี้ในของเราหัวข้อปัญญาประดิษฐ์-

TJ Denzer เป็นผู้เล่นและนักเขียนที่มีความหลงใหลในเกมที่ครองใจมาตลอดชีวิต เขาค้นพบหนทางสู่บัญชีรายชื่อ Shacknews ในช่วงปลายปี 2019 และทำงานในตำแหน่งบรรณาธิการข่าวอาวุโสตั้งแต่นั้นมา ระหว่างการรายงานข่าว เขายังช่วยเหลือเป็นพิเศษในโครงการสตรีมสด เช่น เกมอินดี้ที่เน้นเกมอินดี้, Shacknews Stimulus Games และ Shacknews Dump คุณสามารถติดต่อเขาได้ที่[email protected]และพบกับเขาบน BlueSky ด้วย@JohnnyChugs-