На информационном ресурсе применяются рекомендательные технологии (информационные технологии предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети "Интернет", находящихся на территории Российской Федерации)

Политика как она есть

40 942 подписчика

Свежие комментарии

  • Андрей Бедный
    Их и в России полно. Пусть едут в свою Америку и увидят что это такое ))) Я евреям российским, которые меня в антисем...Трамп заявил, что...
  • Лидия Санникова
    Насмешил клоун... Привык к безнаказанности.Слепаков назвал р...
  • Стефан Михайлов Гърбузанов
    Мистер Президент Трумп желаю Вам удачу на выборах ! Победа!Polymarket: шансы...

ИИ уже «почувствовал» нехватку данных

Индустрия ИИ сталкивается с новым препятствием: сокращением доступности данных, пишут СМИ. Согласно исследованию, проведенному MIT под руководством Data Provenance Initiative, многие ключевые веб-источники теперь ограничивают использование своих данных, что сказывается на обучении мощных систем. Исследователи проанализировали 14 000 доменов, используемых в трех основных наборах данных для обучения ИИ и обнаружили значительный «зарождающийся кризис согласия».

За последний год около 5% всех данных и 25% данных самого высокого качества были ограничены протоколом «исключения роботов» (Robots Exclusion Protocol) — инструментом, который владельцы сайтов используют для блокировки автоматических сборщиков данных. Исследование также показало, что до 45% данных в наборе данных C4 теперь ограничены условиями обслуживания веб-сайтов. Эти ограничения затронут не только компании, занимающиеся разработкой искусственного интеллекта, но и исследователей, ученых и некоммерческие организации, использующие веб-данные.

 

Ссылка на первоисточник

Картина дня

наверх