Дигитални паразити: AI ботове изчерпват ресурсите на Уикипедия

25.04.2025 14:12

От началото на 2024 година Фондация Уикимедия (организацията, която поддържа Уикипедия) отчита драматично увеличение на трафика към своите сървъри. Само за няколко месеца използваният трафик за изтегляне на мултимедийно съдържание е нараснал с цели 50%. Но причината не е внезапен скок в интереса на читателите към енциклопедичното съдържание.

Виновниците за това рязко увеличение са автоматизирани ботове за извличане на данни, които масово свалят статии, изображения, видеа и други файлове от платформите на Уикимедия. Целта им е ясна – да захранят с информация моделите за генеративен изкуствен интелект, които стават все по-гладни за качествено съдържание.

Това безпрецедентно натоварване на инфраструктурата на Уикипедия вече води до осезаеми проблеми. При събития, предизвикващи висок обществен интерес, достъпът до съдържание може да се забави значително.

(adsbygoogle = window.adsbygoogle || []).push({});

Показателен пример е случаят с кончината на бившия американски президент Джими Картър през декември миналата година. Повишеният интерес към видеото от президентския му дебат с Роналд Рейгън доведе до забавяне на зареждането на страницата за някои потребители. Уикимедия обикновено е подготвена за такива пикове в човешкия трафик, но когато към тях се добави и непрестанното натоварване от AI ботове, системата започва да се задъхва.

Проблемът не е само в скоростта на достъп. Зад кулисите се крие финансово предизвикателство, което заплашва устойчивостта на целия проект. Екипът на Уикимедия обяснява това с начина, по който работи тяхната инфраструктура.

Когато много хора търсят една и съща информация – например актуална новинарска тема – Уикимедия създава кеш на това съдържание в центровете за данни, най-близки до потребителите. Това позволява бързо зареждане и ефективно използване на ресурсите.

Но ботовете за AI обучение действат по съвсем различен начин – те масово изтеглят и по-малко популярни страници, които не са кеширани и трябва да бъдат извлечени от основните сървъри на организацията. Това консумира повече ресурси и увеличава оперативните разходи на фондацията.

По-задълбочен анализ разкрива шокираща статистика – 65% от трафика, който изчерпва ресурсите на Уикимедия, идва именно от тези ботове. Това създава постоянни предизвикателства за екипа, които се грижи за надеждността на сайта, защото блокирането на огромното количество ботове поглъща огромна част от времето им. В същото време, организацията, която разчита на дарения, няма средства да увеличи броя на специалистите в този тим. Без нови поддръжници и дарители, бъдещето на Уикипедия е под въпрос.

Уикимедия вече планира през следващата фискална година да въведе платен достъп до съдържанието си от разработчици на AI модели. Това е станало неизбежно, тъй като организацията не вижда никакви признаци, че трафика генериран от AI ботове ще намалее в обозримо бъдеще.

Източник: tehnocafe.com

Технологии
Подобни  

Полицията се готви да въведе система с ИИ, която ще може да “предсказва” извършването на престъпления в метрото на Ню Йорк

04.05.2025 17:57    

Метрополитенът на Ню Йорк изследва възможностите на изкуствения ин

Много скоро Microsoft Authenticator ще изтрие запазените ви пароли. Ето какво трябва да направите, за да не ги загубите.

Microsoft започва поетапно премахване на функциите за управление на пароли в приложението Authenticator, като процесът ще протече в три етапа:

NotebookLM на Google вече предлага аудио обобщения на 76 нови езика, включително български

, позволява на потребителите да генерират подобни на подкаст аудио обобщения с помощта на виртуални водещи. Тези обобщения се създават на базата на

Изкуственият интелект като оръжие за манипулация: Експеримент в Reddit показва колко уязвими са хората

Екипа тайно пускат в действие AI ботове, които публикуват над 1700 коментара в продължение на няколко месеца. Тези ботове не просто участват в диск