Толока (сервис)
| Толока | |
|---|---|
| | |
| Тип | бизнес |
| Основание | 2014 |
| Основатели | Ольга Мегорская |
| Отрасль | интернет |
| Сайт | toloka.ai |
Толо́ка (ранее Яндекс Толока) — краудсорсинговый проект, созданный в 2014 году[1] для быстрой разметки большого количества данных, которые затем используются для машинного обучения и совершенствования поисковых алгоритмов[2]. Как правило, размещаемые задания достаточно простые, для их исполнения не требуется специальная подготовка[3]. В основном они связаны с анализом и оценкой контента[4]. Поэтому любой желающий может выполнять задания и получать за них вознаграждение[5].
Название сервиса
Толо́ка — это форма деревенской взаимопомощи в России, Украине, Белоруссии, Эстонии, Латвии и Литве. Её организовывали в деревне для выполнения срочных работ, требующих большого количества работников: сбор урожая, вырубка леса, сооружение домов и т. д. Иногда толоку использовали для проведения общественных работ (строительство церквей, школ, дорог и т. п.).
Идея совместной полезной работы на общий результат сочетается с принципом краудсорсинга[6].
Виды заданий и область применения результатов
Совершенствование поисковых алгоритмов
Результаты разметки помогают улучшить качество поиска и эффективно настраивать алгоритмы распределения его результатов. Так, в августе 2017-го года Яндекс представил новый поисковый алгоритм «Королёв», при создании которого для обучения нейронных сетей использовались оценки толокеров. За два с лишним года существования сервиса они дали около двух миллиардов оценок, которые позволили разработчикам значительно усовершенствовать свой алгоритм[7].
Развитие машинного обучения
Чтобы машина поняла, как решать ту или иную задачу, необходимо показать ей огромное количество примеров, как положительных, так и отрицательных[8]. Пользователи сервиса Яндекс Толока в числе других задач могут получать и задания по описанию объектов, определённых компьютером на изображении. Например, на фото помечены объекты, которые смог определить искусственный интеллект, но для применения этих данных в деле требуется точно знать, что это за объекты, чтобы обучить искусственный интеллект по массе таких определений человеком. Который, в свою очередь, получит за такую работу вознаграждение.[2] Кроме того, в Толоке производят проверку автоматически полученных черновиков словарных статей для Яндекс Переводчика.[9]
Аудит и маркетинговые исследования
Проверка качества работы интернет-магазина, службы доставки, написание отзывов о продуктах и услугах. Например, в 2017 году пользователи Толоки принимали участие в проверке качества работы сервиса возврата товара на Яндекс Маркете. Подобные эксперименты позволяют контролировать качество работы сервиса и выявлять слабые места, над которыми в дальнейшем будет проведена работа по улучшению и устранению выявленных проблем.[10] В другом проекте пользователям предлагалось написать отзыв на товар из популярных категорий и снабдить его собственными фотографиями[11][12].
Выбор дизайна и названий новых продуктов и сервисов
Ответы на вопросы, связанные с выбором наиболее удачного названия и дизайна для нового продукта или сервиса[13], личными или потребительскими предпочтениями пользователей. В одном из таких опросов толокеры выбирали название для голосового помощника Яндекса[14]. Целью задания было — определить черты характера девушки с тем или иным именем. Для опроса взяли как нужные характеристики так и совсем неподходящие, и стали спрашивать: „Если у девушки вот такое имя, то она скорее добрая или агрессивная?“. С большим отрывом в опросе победило имя «Алиса».[15]
Вознаграждение и вывод средств
Задания в Толоке оплачиваются — сумма, которую можно заработать, указана рядом с заданием[8]. Для вывода средств можно воспользоваться системами: ЮMoney (Бывшие Яндекс Деньги), PayPal, Qiwi. На этапе отладки процессов со стороны Толоки вывод денег может занимать от нескольких минут до месяца[6].
Мобильные приложения
Для решения задач, которые требуют работу «в поле» (например, пойти по адресу и проверить актуальность информации об организации), существует мобильная версия Толоки[6]. Сервисом разработаны два приложения — для Android и iOS.
Пользователи
Пользователи Толоки, или толокеры — люди, которые за вознаграждение выполняют задания по тестированию и улучшению системы на краудфандинговой площадке Яндекс. Толока[16]. В настоящее время в Толоке около 4 миллионов зарегистрированных пользователей[17] из России, с Украины, из Белоруссии, Казахстана, Узбекистана, Турции, Франции, Индонезии и других стран[18], которые выставили более 2 миллиардов оценок[5]. В 2018 году в проектах в «Толоке» поучаствовало больше миллиона людей[17]. Большинство толокеров — это молодые люди до 35 лет (как правило, студенты технических вузов или мамы в декрете).[6] В основном исполнители рассматривают Толоку в качестве дополнительного источника денег, хотя многие отмечают, что им нравится выполнять полезную работу, делать интернет чище.[6] В 2017 году интернет-холдинг Яндекс наградил 25-летнего челябинца Илью Михаленко за наибольший вклад в совершенствование поисковой системы.[19] На церемонии запуска нового алгоритма поиска челябинцу вручили статуэтку в виде ракеты как символа того, что вводимые работниками Яндекса инновации сопоставимы с полётами людей в космос.[1]
Заказчики
Все задания в Толоке размещают Заказчики. Основные направления использования «Толоки» внутри проектов «Яндекса» — это сбор и обработка данных для проектов, связанных с машинным обучением, речевыми технологиями, компьютерным зрением, умными алгоритмами «Поиска» и т. д., модерация контента (разговоры в «Яндекс Картах»), полевые задания (актуализация данных об организациях в «Справочнике»), оптимизация внутренних бизнес-процессов (поиск публикаций в соцсетях, разметка упоминаний Яндекса по тональности на позитивные и негативные). Поскольку над задачей одновременно работают как минимум сотни, а то и тысячи толокеров, результаты готовы в худшем случае на следующий день[2].
Критика
Для выявления и изъятия ЛГБТ-книг интернет-издательство Ridero использовало нейросеть, обучавшуюся с помощью «Толоки», пользователям которой предлагали прочитать текст и указать, одобряется ли в нём «существование лесбиянок, геев, бисексуалов и трансгендеров», смена пола, зоофилия, некрофилия, идеи чайлдфри или инцест. В пресс-службе «Яндекса» сообщили, что отозвали это задание, сочтя его оскорбительным[20].
Согласно данным взлома белорусскими хакерами Главного радиочастотного центра Роскомнадзора в ноябре 2022 г., «Яндекс. Толока» используется Роскомнадзором для обучения нейросетей ищущего «запрещённый контент» «Чистого интернета»[21].
Исследования в Толоке
Толока — это не только инструмент для решения прикладных задач, но и площадка для научных исследований в разных предметных областях. В мае 2019 года команда сервиса начала публиковать наборы данных для некоммерческих, академических целей, чтобы поддержать научное сообщество и привлечь исследователей в Толоку. Датасеты могут быть интересны исследователям разных направлений: для лингвистических исследований, для задач компьютерного зрения, для тестирования моделей агрегации вердиктов исполнителей и обучения чат-ботов[22].
Примечания
- 1 2 Яндекс назвал своим лучшим толокером жителя Челябинска. АН "Доступ". 23-08-2017. Архивировано 2018-09-06. Дата обращения: 2018-02-19.
{{cite news}}: Проверьте значение даты:|date=(справка) - 1 2 3 Александр Лычавко (15-01-2018). «Зимой выхлопные газы кажутся лидару стеной». Как в минском офисе «Яндекса» разрабатывают беспилотники. dev.by. Архивировано 2018-02-18. Дата обращения: 2018-02-15.
{{cite news}}: Проверьте значение даты:|date=(справка) - ↑ Дмитрий Шихов (17-01-2018). Uber в ритейле: как это работает. Rusbase. Архивировано 2018-01-17. Дата обращения: 2018-02-15.
{{cite news}}: Проверьте значение даты:|date=(справка) - ↑ Алексей Берилло (23-10-2017). Конференция Nvidia GTC 2017 Europe: первым делом автопилоты. ixbt.com. Архивировано 2018-02-02. Дата обращения: 2018-02-19.
{{cite news}}: Проверьте значение даты:|date=(справка) - 1 2 Роман Рожков (23-08-2017). «Яндекс» подключил «Королева» к поискам. Комерстантъ. Архивировано 2018-10-06. Дата обращения: 2018-02-19.
{{cite news}}: Проверьте значение даты:|date=(справка) - 1 2 3 4 5 TolokaTeam (20-07-2016). Яндекс.Толока. Как люди помогают обучать машинный интеллект. habrahabr. Архивировано 2017-03-31. Дата обращения: 2018-01-19.
{{cite news}}: Проверьте значение даты:|date=(справка) - ↑ Денис Сухов (22-08-2017). Компания «Яндекс» представила новый поисковый алгоритм «Королев». Комсомольская Правда. Архивировано 2018-10-06. Дата обращения: 2018-01-22.
{{cite news}}: Проверьте значение даты:|date=(справка) - 1 2 Иван Кущ (23-08-2017). Нейросети, космос, человек: «Яндекс» представил новый поиск. Будь мобильным!. Архивировано 2017-08-26. Дата обращения: 2018-02-19.
{{cite news}}: Проверьте значение даты:|date=(справка) - ↑ Екатерина Еникеева (30-01-2018 г.). Как робот-переводчик находит и выучивает новые слова. N + 1. Архивировано 2018-10-06. Дата обращения: 2018-02-15.
{{cite news}}: Проверьте значение даты:|date=(справка) - ↑ «Яндекс» запустил эксперимент «Контрольная закупка на Маркете». retail.ru. 13-02-2017.
{{cite news}}: Проверьте значение даты:|date=(справка) - ↑ В товарных отзывах на "Маркете" появятся фото. oborot.ru. 05-04-2017. Архивировано 2020-09-20. Дата обращения: 2018-02-19.
{{cite news}}: Проверьте значение даты:|date=(справка) - ↑ «Яндекс.Маркет» предложил пользователям писать отзывы к товарам за деньги. Афиша daily. 20-02-2017.
{{cite news}}: Проверьте значение даты:|date=(справка) - ↑ Саша Море (02-02-2018). Дизайн продукта от начала до конца. vc.ru.
{{cite news}}: Проверьте значение даты:|date=(справка) - ↑ Василий Волнухин (13-02-2018). Директор Яндекса по технологиям: программисты из России – это уже давно серьезный бренд.
{{cite news}}: Проверьте значение даты:|date=(справка) - ↑ Daria Khokhlova (10-10-2017). Как «Яндекс» создавал «Алису». vc.ru.
{{cite news}}: Проверьте значение даты:|date=(справка) - ↑ Чем жила Челябинская область: главные новости недели. АН "Доступ". 27-08-2017. Архивировано 2018-09-06. Дата обращения: 2018-02-19.
{{cite news}}: Проверьте значение даты:|date=(справка) - 1 2 Татьяна Петрущенкова (08-04-2019). «Мы хотим монетизировать экспертизу в краудсорсинге». Rusbase. Архивировано 2019-04-11. Дата обращения: 2019-04-11.
{{cite news}}: Проверьте значение даты:|date=(справка) - ↑ Давид Нармания (23 сентября 2017). Двадцать лет спустя: как "Яндекс" стал не только поисковиком. РИА новости. Архивировано 9 ноября 2017. Дата обращения: 19 января 2018.
- ↑ Челябинец стал лучшим тестером Яндекса. ГТРК “Южный Урал”. 23-08-2017. Архивировано 2018-09-06. Дата обращения: 2018-02-19.
{{cite news}}: Проверьте значение даты:|date=(справка) - ↑ Чернокнижники. Как закон о «пропаганде» ЛГБТ, вступивший в силу неделю назад, уже изменил издательский рынок. Медиазона. 12 декабря 2022.
- ↑ Архитектура российской цензуры: что мы узнали из крупнейшей утечки в истории Роскомнадзора. Главное. Русская служба Би-би-си. 9 февраля 2022. Архивировано 16 мая 2023. Дата обращения: 6 сентября 2024.
- ↑ Яндекс открывает датасеты Толоки для исследователей. habr.com. Дата обращения: 2 июля 2019. Архивировано 2 июля 2019 года.