В забележително издание от Уестлейкския университет тази система вече е надминала човешките показатели с 183,7%.
NLP лабораторията на Уестлейк от Уестлейк въведе DeepSientist, първият AI учен, способен на пълно, автономни изследвания. Тази система демонстрира целенасочени итеративни научни открития, прогресивно надминавайки най-добрите човешки експерти без човешка намеса.
В задача за откриване на текст на AI, DeepScientist реализира и тества над 1000 хипотези само за две седмици, постигайки напредъка, еквивалентен на три години човешки усилия. На набора от данни на RAID методът му доставя 7,9% AUROC подобрение, превъзхождайки съществуващите човешки най-съвременни (SOTA). Той също така постигна нови резултати от SOTA при приписване на отказ на агент и ускорение на разсъжденията на LLM.
За разлика от предишните AI системи, които изискват ясни директиви и често произвеждат изход с ниска стойност, DeepScientist активно идентифицира ограниченията в авангардни изследвания, предлага нови идеи, пише код, провежда експерименти и изготвя пълни документи. Това преминаване от случайно откриване към продължително, проактивно проучване бележи влизането на AI в най -креативните сфери на науката.
DeepScientist формализира откриването като йерархичен проблем с оптимизацията на Байесов, като се стреми да увеличи максимално ценните констатации в рамките на определен бюджет. Той оперира тристепенна оценка, където идеите се тестват при увеличаване на нивата на вярност и разходи. Обещаващи констатации напредват за допълнителни ресурси, докато други информират бъдещото проучване чрез a “Констатации памет,” Осигуряване на ефективно разпределение на ресурсите.
Тествани по конкурентни задачи като AI Text Detection и Agent Failure Attribution, изпълнението на DeepScientist беше забележително. Отвъд успеха на набора от данни на RAID, той замисли нов метод на A2P за приписване на отказ, повишавайки ефективността на WHO & When Benchmark до 183.7% над човешката SOTA.
Най-важното е, че DeepScientist се отличава в среди с ниска степен на успех. Структурираният му подход балансира изследването и експлоатацията, което позволява постоянен напредък, когато методите на груба сила се провалят. Експериментите също разкриха a “Закон за мащабиране” За откриване: Увеличаването на ресурсите на графичния процесор линейно увеличаваше седмичните констатации с високо въздействие.
DeepScientist означава нова парадигма на сътрудничество между човека, където AI действа като двигател за изследване, освобождавайки човешките учени да определят дълбоки въпроси и да предоставят крайна преценка. Екипът е отворен източник на основната система, за да ускори тази визия.
Source link
Like this:
Like Loading…
Нашия източник е Българо-Китайска Търговско-промишлена палaта