
Двама автори зад проект за изкуствен интелект на Станфордския университет се извиниха на китайския екип зад AI модела с отворен код MiniCPM-Llama3-V 2.5, след като потребителите на социалните медии в Китай опровергаха първия, че е плагиатствал последния модел, разработен от университета Цинхуа и ModelBest Inc. Инцидентът предизвика широка дискусия в китайския интернет.
Двама автори от екипа Stanford Llama3-V, Сидхарт Шарма и Акш Гаргднес се извини на екипа на MiniCPM на сайта на социалните медии X за тяхното академично лошо поведение, като обяви, че ще изтегли модела Llama3-V от употреба.
Защо има значение: Членовете на екипа на Станфорд признаха, че са плагиатствали от университета Цинхуа и работата на ModelBest Inc.
подробности: „Искрено се извиняваме на авторите на MiniCPM за неуспеха ни да проверим оригиналността на Llama3-V“, написаха Aksh и Siddharth на X днес. „Мустафа, който написа кода, описа вълнуващи разширения, които популяризирахме, без да знаем за предишната работа на OpenBMB (основан от университета Цинхуа и ModelBest Inc). Ние поемаме пълна отговорност за този пропуск. Премахнахме всички препратки към Llama3-V по отношение на оригиналните автори.”
- На 29 май екип от Станфорд AI заяви онлайн, че може да обучи мултимодален голям модел, надминаващ GPT-4V само за $500, според местна медия Квантов бит. Впоследствие потребителите на социалните медии откриха, че моделът Llama3-V на екипа използва моделна структура и код, много подобен на MiniCPM-Llama3-V2.5 на ModelBest, с частични модификации на името на променливата. Llama3-V също така включва същия токенизатор като MiniCPM-Llama3-V 2.5, включително новодефинираните специални символи на последния.
- На 2 юни китайската фирма ModelBest Inc потвърди, че проектът за голям модел на Станфорд Llama3-V, подобен на MiniCPM, е в състояние да идентифицира древните китайски знаци Qinghua Jian от периода на Воюващите държави в Китай. Забележително е, че мачовете също споделят идентични грешки. Тези данни за героите, получени от изследователския екип чрез месеци на сканиране и ръчно анотиране на всеки герой Qinghua Jian, не са били публично разкрити, което потвърждава акта на плагиатство.
- „Въпреки че е добре да бъдем признати от международни екипи, ние вярваме в изграждането на общност, която е отворена, кооперативна и заслужаваща доверие,“ Изпълнителен директор на ModelBest Inc Ли Дахай заяви. „Искаме работата на нашия екип да бъде забелязана и уважавана, но не по този начин.“
- Главният учен на ModelBest Inc, Liu Zhiyuan, който също е титуляр доцент в университета Цинхуа, каза пред Yicai репортер че бързото развитие на изкуствения интелект разчита на глобалното споделяне на алгоритми, данни и модели. „Двама от тримата членове на този екип на Llama3-V са просто студенти в Станфордския университет и им предстои дълго пътуване. Ако могат да признаят грешките си и да се поправят, това би било голяма добродетел“, каза той.
- Кристофър Дейвид Манингдиректорът на Станфордската лаборатория за изкуствен интелект, също излезе с изявление, осъждащо акта на плагиатство и възхвалявайки китайския модел с отворен код MiniCPM.
Контекст: Основана през август 2022 г., ModelBest Inc осигури нов кръг от финансиране на стойност стотици милиони RMB през април. Hubble Technology Venture Capital на Huawei ръководи инвестицията с участието на Chunhua Capital, Beijing Artificial Intelligence Industry Investment Fund и китайската Quora-подобна платформа Zhihu. През февруари ModelBest Inc стартира модела с отворен код MiniCPM.
Свързани
Нашия източник е Българо-Китайска Търговско-промишлена палaта