
За новыми идеями военные специалисты Управления перспективных исследований Министерства обороны США (DARPA) в последние годы стало активно обращаться к гражданским лицам. И просьбы становятся все более необычными. Например, не так давно они искали добровольцев для поиска красных метеорологических шаров через социальные сети (см. «КП» здесь). И сотрудникам Массачусетского технологического института удалось найти десять красных метеорологических зондов, раскиданных по США, всего за 8 часов 52 минуты.
А в октябре DARPA объявило новый конкурс Shredder Challenge. Приглашались «компьютерные специалисты, энтузиасты головоломок и все, кто любит решать сложные задачи». $50 тыс. было обещано за восстановление пяти измельченных документов. Любой желающий мог зарегистрироваться и загрузить документы из Сети (все они на разные темы и все разрезаны разными методами). После этого участник получал шесть недель на то, чтобы представить свое решение.
Смысл конкурса прост: разведка зачастую получает доступ к конфиденциальным документам, когда те представляют собой собрание клочков бумаги. DARPA ищет новые пути для того, чтобы работа по восстановлению протекала наиболее эффективно. Что лучше — делать это вручную или создавать алгоритмы? Поможет ли краудсорсинг?
- Сегодня этот процесс слишком медленный и трудоемкий, особенно если документы составлены от руки, — признавался директор информационного бюро инноваций DARPA Дэн Кауфман.
И вот сегодня в США назвали лучших восстановителей измельченных документов. Конкурс Shredder Challenge завершен, сообщает membrana.ru.
Первое место и призовые $50 тысяч завоевала команда программистов из Сан-Франциско под названием «Все ваши обрезки принадлежат США» (All Your Shreds Are Belong To U.S.). Она быстрее и точнее соперников собрала все пять пазлов, то есть документов, разрезанных в общей сумме на 10 тысяч тонких полосок. И еще она первой ответила на связанные с загадками вопросы относительно городов и людей, упоминаемых в текстах.
Ключом к успешному решению задания оказалось сочетание чисто машинного подхода (сортировка и сравнение фрагментов) с творческой работой людей-сборщиков, отмечают специалисты агентства DARPA. Программа-победитель подбирала отсканированные кусочки бумаг друг к другу лишь вчерне и предъявляла пары для проверки членам команды.
Последние не просто по буквам отслеживали верные сочетания соседних полосок, а использовали по ходу восстановления документов разбросанные по ним подсказки, то есть обращали внимание на смысл складывающихся головоломок.

К примеру, в первом тексте упоминается название фильма, который снял режиссёр Анатоль Литвак в 1937 году. В энциклопедии можно узнать, что в данном году Литвак выпустил две ленты – «Товарищ» и «Женщина, которую я люблю». Товарищ по-английски – comrade, и это как раз то слово, с которого начинается первый документ.
Загадка номер пять была самой сложной во всей серии. Здесь было разрезано и перемешано сразу три листка бумаги (на фото показан только третий — до измельчения и после восстановления). Один из трёх листов был исполосован в направлении, перпендикулярном двум другим, а общее число кусочков составило более шести тысяч! Вдобавок небольшая часть текста представляла собой морзянку в виде нагромождения повторяющихся слов dit и dah.
Собрав третий документ (на фото под заголовком), участники должны были назвать судьям задуманный в загадке город — Сьенфуэгос. Интересно, что напрямую в документе этот город не упоминался, но зато там были указаны географические координаты Гаваны, нарисованы очертания Кубы и дан набросок весьма известного городского парка Сьенфуэгоса.
При выборе победителя учитывалось не только первенство в сборке пазлов. За те или иные правильные ответы на вопросы по содержанию документов судьи начисляли дополнительные баллы. Группа All Your Shreds Are Belong To U.S. оказалась лучшей не только в деле программирования, но и просто эрудиции, сообразительности.