Компания Vicarious впервые поделилась подробностями о новом алгоритме компьютерного зрения, позволяющем роботам обходить CAPTCHA — автоматизированную систему идентификации, которая используется для предотвращения автоматизированных атак, массовой регистрации аккаунтов и рассылки спама. Стартап, привлекший $150 миллионов от ряда крупных инвесторов, включая Марка Цукерберга и Илона Маска, держал разработку в тайне на протяжении нескольких лет.
CAPTCHA, созданная в 2000 году исследователями из университета Карнеги-Меллона, является вариацией теста Тьюринга. Обычно она представляет собой деформированные цифры и буквы, которые, как считается, не может распознать компьютерная программа. Проверку на "человечность" обманывали и ранее, поэтому из-за постоянно прогрессирующих программ-взломщиков "капчу" постоянно приходилось усложнять. Иногда это приводит к тому, что разобрать искаженные символы становится сложно и человеку.
В 2013-м инженеры Vicarious заявили о разработке алгоритма, который взламывает CAPTCHA с вероятностью 90%. В компании тогда отмечали, что новая программа симулирует визуальное распознавание, как оно происходит в человеческом мозге, что позволяет достичь наилучшего результата при минимальном использовании ресурсов. Подробности системы не раскрывались, чтобы не облегчать задачу спамерам.
Достижения в области компьютерного зрения, сделанные в последние годы, привели к тому, что теперь ИИ не составляет большого труда увидеть на картинке животное или выполнить простую арифметическую операцию. По словам соучредителя Vicarious Дилипа Джорджа, их система использует рекурсивную кортикальную сеть (RCN), которая "думает", как человек. Об этом сообщается в статье, опубликованной в журнале Science.
Имитируя работу мозга, RCN способна воспринимать визуальную информацию, которой её не учили. Например, анализируя форму, наклонные линии и закругления, нейросеть сможет догадаться, что на картинке изображена размытая буква "А". Как говорит Джордж, RCN может использоваться не только для взлома "капчи", но и для более эффективного обучения роботов. "Эффективность данных и логическое мышление очень важны, когда роботам приходится иметь дело с неструктурированной средой", — сказал он.