В основата на инициативата стои Claude Mythos Preview – нов, все още непубликуван модел от Anthropic. Компанията го описва като модел от ново поколение с възможности, които биха могли да преобразят киберсигурността. Според данните на Anthropic, Mythos вече е открил хиляди уязвимости с висока степен на критичност, включително проблеми във всички основни операционни системи и уеб браузъри – някои от тях са оставали незабелязани от човешки експерти в продължение на десетилетия.
Моделът не само идентифицира пропуски в сигурността, но може и да генерира експлойти, както и да предлага или създава корекции за пълен цикъл на работа. По отношение на производителността Mythos значително превъзхожда своя предшественик – модела Opus 4.6 на Claude. При тестове за агентно програмиране, логическо мислене и компютърна употреба новият модел удвоява резултатите на Opus 4.6 в бенчмарка SWE-bench Multimodal.
Въпреки впечатляващите си възможности, Claude Mythos Preview няма да бъде пуснат за публично ползване. Anthropic счита модела за твърде мощен и потенциално опасен, тъй като може да послужи като кибер оръжие, ако попадне в ръцете на престъпници. Mythos би могъл драстично да увеличи броя и сложността на кибератаките, като при това с таков ефективен инструмент дори подсредствен хакер ще е изключително опасен.
Достъп до модела ще имат само одобрените партньори в коалицията, като той ще бъде предоставян чрез облачни платформи като AWS и Google Cloud. Допълнително над 40 организации, които поддържат критична софтуерна инфраструктура, също ще получат възможност да използват технологията.
Anthropic се е утвърдила като една от водещите AI компании, които повдигат въпроси за етиката в областта. По-рано тази година компанията отказа да премахне защитните механизми на своите услуги за използване от Пентагона, което доведе до санкция от Министерството на отбраната с обозначение за “риск в веригата на доставки”.
Стартирането на Project Glasswing може да се окаже полезна стъпка към подобряване на киберсигурността в ерата на изкуствения интелект, макар че част от щетите вече са нанесени и кибер престъпниците вече активно използват LLM моделите за извършване на атаки и престъпления.
