Потратил $600 тысяч и 5 лет, чтобы создать свой переводчик. История Lingvanex

«Это невозможно», «Куда тебе конкурировать с Google?», «Как ты можешь сделать не хуже?» — эту критику инженер-программист Алексей Рудак слышит уже 5 лет, пока с нуля создает программу-переводчик Lingvanex. Он убедился в перспективности этой ниши, когда в одиночку сделал и протестировал более 600 разных приложений, и самыми популярными стали переводчики.  В результате он получил около 35 млн скачиваний и заработал $ 1 млн — а затем вложил все в Lingvanex. 

Только сейчас он готовится выйти на рынок с этим проектом. — Уже 5 лет я работаю на пределе своих возможностей. Хочешь спать, болит голова — не важно. Нужно идти вперед, хотя порой опускаются руки и хочется все бросить. Но лучше жалеть о сделанном, чем о несделанном.

У меня не было связей и бизнес-опыта.Съемная квартира, сломанный диван, пачка пельменей и ноутбук — вот с чего все начиналось.За эти годы произошло много событий. Я сам собирал мощный компьютер для тренировки нейросети, писал ученым с тараканами в голове, сотрудничал с испанскими аспирантами… Чтобы все эти истории рассказать, дня не хватит. Но что мне говорят потенциальные инвесторы, сотрудники, партнеры? «Расскажи за 2 минуты…»

Как я искал нишу для бизнеса

Я всегда мечтал заработать много денег. Устраивался iOS-разработчиком в Минске, накапливал 4−5 тысяч долларов и увольнялся, чтобы создавать собственные проекты. Несколько раз я уезжал домой, в Новополоцк, чтобы сэкономить деньги на жизнь. Там я создавал образовательные и туристические сайты, программу для бухгалтерии, игры для мобильных телефонов. Но из-за отсутствия опыта ведения бизнеса это не приносило дохода, и вскоре проекты закрывались. Приходилось снова ехать в Минск — работать и снова копить. Так прошло шесть лет.

Новополоцк. Фото с сайта votpusk.ru
Новополоцк. Фото с сайта votpusk.ru

Когда у меня в третий раз закончились деньги, я, наконец, стал думать иначе. Наступил кризис, я не мог найти работу. В Новополоцке, небольшом провинциальном городе, советы из бизнес-книг крутых американских авторов не работают. За новой информацией приходилось ездить на бизнес-встречи и конференции в Минск. Но вскоре я понял, что это всего лишь теория, а на практике все иначе. У меня попросту не было денег, чтобы нанять команду крутых специалистов и сделать качественный проект. Настало время для переосмысления: я в маленьком городе, один, нет денег, опыта, связей. Я уже не могу начать проект просто «для души». Что делать?

Мой основной навык — разработка мобильных приложений для iPhone. Несколько лет работы в ИТ-компаниях позволили накопить опыт, и я решил сделать много простых и принципиально разных приложений (игры, музыка, рисование, ЗОЖ, изучение языков) и протестировать, на какие будет наибольший спрос. Разумеется, я не делал их вручную, это было бы слишком долго. Я написал платформу, которая позволяла относительно быстро создавать приложения на различную тематику. В них было несколько картинок, 2 кнопки и всего одна функция. Но этого было достаточно, чтобы проверить идею. Например, приложение для бега отслеживало скорость человека, пройденное расстояние, а также подсчитывало калории. На создание 600 приложений я потратил полтора года. Аккаунт в AppStore для размещения этих приложений стоил мне $ 99 в год.

Пример приложений, созданных Алексеем Рудаком
Пример приложений, созданных Алексеем Рудаком

Сначала приложения были бесплатными. Затем я стал подключать рекламу, добавил платные функции, стоимость которых начиналась от $ 1,99. Суммарно я получил 35 миллионов скачиваний без затрат на рекламу.

2 перспективные ниши, которые я нашел

Я заметил направления, которые явно отличались по скачиваниям, — это были переводчики и музыкальные программы (которые симулируют игру на пианино, барабанах или, например, гитарные аккорды). Буквально за месяц переводчики скачали более 1 млн раз. И это при том, что они находились примерно на 100-й позиции в рейтинге.

Музыкальные приложения были менее перспективны. Пользователей для них нужно привлекать по ключевым словам, а их в этой нише не много: тот, кто ищет приложения для гитары, так и пишет — «гитара», «бас-гитара», «аккорды» и т.д. Сложно подобрать много синонимов. Таким образом, пользователи сконцентрированы на высокочастотных запросах, и рано или поздно их привлечение будет стоить дорого.

Другое дело — переводчики.

На всех приложениях, которые были сделаны для тестов по поиску ниши, я заработал около миллиона долларов. Из них более половины — на переводчиках.

Языковых пар в мире тысячи, и люди вводят запрос не общим словом «переводчик», а несколько слов как решение своей проблемы: «перевести с арабского на французский», «переводчик с китайского». Раз запросов много, привлекать пользователей можно дешевле. Я понял, какую нишу стоит занять.

Почему я решил создать свою технологию перевода

Вначале мои приложения-переводчики (порядка 40) создавались очень просто — использовался перевод, который предоставлял Google API. Я платил корпорации по $ 20 за 1 млн переведенных через Google Translate символов. Затем я запустил улучшенные версии приложений — добавил рекламу, встроенные покупки, перевод голоса. Повысив качество, сделал приложения платными, примерно по € 7.

Я переехал в Минск и купил квартиру. Мой образ жизни почти не изменился — я ел все те же пельмени, покупал одежду в секонд-хенде. Все деньги уходили на дальнейшее развитие бизнеса. Период роста продолжался около года. На то время у меня было 50−70 приложений для перевода (2 языковые пары на каждое из приложений плюс один универсальный переводчик сразу на все языки) и 5 млн скачиваний.

Но с ростом пользователей увеличивался расход на платный Google API (технологии перевода). Прибыльность бизнеса серьезно снизилась. Настал момент, когда 70% выручки уходило на расходы. С такими объемами перевода я мог войти в долги. Чтобы окупить расходы, нужно было добавлять много рекламы в приложения. Но это всегда отпугивает пользователей. Чтобы решить эту проблему, требовалось не зависеть от Google и двигаться на новые рынки, то есть создавать приложения для Android, Mac OS и Windows Desktop.

Фото с сайта dev.by
Фото с сайта dev.by

Я пробовал просить совета и инвестиций у стартапов и ИТ-сообщества, но поддержки не встретил. В основном эксперты и инвесторы не понимали, в чем интерес работать на рынке, где уже есть лидер — Google-переводчик. Также обращался к нескольким крупным компаниям, предлагая $ 30 тысяч за их лицензии технологий перевода на 40 языков. Это позволило бы мне переводить неограниченное количество раз за фиксированную цену и обслуживать любое количество пользователей. Но мне в ответ называли сумму в 2−3 раза выше. Это было слишком дорого.

Было решено попробовать сделать свою технологию для перевода. Я обратился к знакомому, который владеет аутсорс-компанией в Минске. В конце 2016 года он выделил для меня команду из 7 сильных разработчиков. Работа началась.

Я рассчитывал, что решу задачу за полгода, но постепенно убеждался, что все гораздо сложнее. За все время я потратил около $ 600 тысяч на разработку и только сейчас запускаю продукт на рынок.

«Как вы можете добиться качества уровня Google Translate?»

Это главный вопрос, который мне задают все эти 5 лет. Мало кто верит, что создавать переводчик — хорошая идея и что это вообще достижимо. Ведь как можно маленькой командой повторить то, что много лет делает Google?

Безусловно, создание переводчика — задача сложная. Чтобы было понятнее, кратко поясню, как создаются переводчики.

Раньше в этой нише использовался статистический машинный перевод с добавлением правил, но новое поколение переводчиков в основном создается на нейронной сети, в том числе и наш. Без понимания грамматики языка нейронная сеть сама находит закономерность между двумя одинаковыми текстами на разных языках. И когда нужно перевести новый текст, она сама выдвигает гипотезы, как неизвестное слово будет переводиться в другом языке, даже если в примерах до этого его не было.

Чтобы нейронная сеть нашла соответствия, мы загружаем в нее как можно больше текстов с переводами на разные языки. Данные берутся из открытых источников. Например, Opus — самый большой источник переведенных текстов. Он содержит протоколы заседаний Европарламента. Они проходят каждый год и выпускаются с относительно качественным переводом. Также Opus содержит переведенные статьи из Википедии, субтитры к фильмам и другое, но там перевод не везде дословный.

Основа перевода — нейросеть, уже сама по себе сложная тема, а к ней еще необходимо добавить узкоспециализированные знания в обработке естественного языка (компьютерная лингвистика). К тому же у каждого языка свои особенности. Чтобы обслуживать миллионы пользователей в день, необходимы сотни мощных серверов, объединенных сложной инфраструктурой.

Один из офисов Google. Фото с сайта redroid.ru
Один из офисов Google. Фото с сайта redroid.ru

Относительно конкуренции с корпорациями у меня есть несколько аргументов:

1. Рынок обработки естественного языка быстро растет. Тема очень сложная. Она имеет большой порог входа из-за дороговизны специалистов и малого количества наработок в открытом доступе. Создать свой проект в этой сфере до недавнего времени было дорого.

Все изменил интерес крупных корпораций в развитии технологии машинного перевода. Они поняли, что проблему качественного перевода можно решить, только объединив усилия и помогая начинающим проектам. Для этого они стали выкладывать свои разработки в открытый доступ, чтобы на базе них каждый желающий мог сделать свой проект в области машинного перевода. Если кто-то добьется хорошего результата, то крупная корпорация с радостью купит их компанию с наработками. Это дешевле, чем делать своими силами.

В разработке переводчика нам помогают даже директора крупных компаний, предоставляющие услуги по машинному переводу. Сами!Это удивительно настолько, что никто не верит. Но причина проста: корпорации ведут между собой войну за технологии и рынок, и они решили позволить желающим создавать для них «патроны», то есть улучшать технологию и продукт, чтобы затем выкупить наиболее успешные проекты и выиграть в своей войне.

2. Мне говорят, что я не найду специалистов в команду, ведь все они уже давно работают в больших корпорациях, т.к. там большие зарплаты и это престижно. Но на самом деле далеко не каждый хочет на них работать. Академическое сообщество предпочитает работать в своих университетах, занимаясь тем, что нравится, со своими студентами, а не решая бизнес-задачи корпораций и работая на износ. Деньги ученых не сильно мотивируют, а интересных задач на всех не хватит.

Развитие проектов в открытом доступе привело к росту научных работ и притоку молодых аспирантов в сферу обработки естественного языка. Это позволило легче искать специалистов и снизило цены на их услуги.

3. Два года назад для тренировки нейросетей, которые нужны для переводчика, был необходим дорогой суперкомпьютер. За пару лет цены на суперкомпьютеры снизились в десятки раз. В марте 2018 компания Nvidia выпускает компьютер DGX-2 размером с тумбочку и производительностью в 2 петаФлопса (FP16), который сейчас можно взять в лизинг от $ 5000 в месяц.

Имея такой компьютер, можно тренировать свои модели с гигантским объемом данных быстро, как и держать большую нагрузку по API. Это кардинально меняет расклад сил всего рынка и позволяет небольшим компаниям конкурировать с гигантами в области работы с большими данными. Мой пример это подтверждает.

«Зачем нам ваш переводчик, если есть Google Translate?»

Еще один частый вопрос. На что я отвечаю: «Несмотря на сильных конкурентов, у нас есть свои преимущества. На большом рынке должен быть ассортимент».

Пример переводчика Lingvanex для iPhone
Пример переводчика Lingvanex для iPhone

Какие у нас преимущества? Такого количества функций совокупно нет ни у одного переводчика, даже у нескольких вместе взятых. Например:

  • Наши приложения работают на большинстве существующих платформ — их 17. Это компьютеры (Mac OS и Windows), мобильные телефоны (iPhone, Android), расширения для браузеров (Chrome, Firefox), чатботы (Facebook, Telegram, Vkontakte, Viber), голосовые помощники (Google, Alexa), носимые устройства (смарт-часы, наушники).
  • Перевод не только текста, голоса, картинок, но и сайтов, больших файлов, телефонных звонков, sms и пр.
  • Перевод голоса без доступа к интернету
  • Перевод через умные наушники (Airpods, Galaxy Buds и более дешевые модели с микрофоном)
  • Можно создавать чаты с переводом
  • Функции для изучения языков — например, добавление слов в закладки, закрепление знаний с помощью чат-бота или умной колонки
  • API и серверные решения для перевода внутри компаний по определенным тематикам (медицина, металлургия, юриспруденция и т.д.). На базе наших технологий каждый может сделать свой переводчик. Кроме того, у нас есть чат-бот для Slack, который решает проблему общения и перевода документации для международных команд, работающих над одним проектом.

Есть и другой аргумент — для этого надо вспомнить, собственно, начало истории: я уже смог заработать на переводчиках, спрос на них был. И даже если сейчас мы займем небольшую долю рынка, он настолько огромен, что нам ее хватит.

«Нас ждет последний рывок»

До недавнего времени я работал один, нанимая сотрудников на аутсорсе, сам управлял проектом и разработкой. Но сложность продукта и количество задач начали быстро расти,и стало очевидно, что нужно делегировать функции и быстро нанимать людей в собственную команду в своем офисе.

Собрать ее было сложно — повторюсь, никто в идею не верил и не понимал, зачем делать переводчик, когда есть Google. Убедить стало легче, когда я смог показать работающие приложения и свое API для перевода.

Сейчас в команде 10 человек. Все они выкладываются по полной, поскольку мотивированы опционами. Для нашей платформы по переводу мы сделали 40 сервисов — распознавание речи, синтез речи, словарное значение, транслитерация, определение частей речи и языка и т.д. Из них можно делать много продуктов в области естественной обработки языка всем желающим. Все это доступно на нашем API.

Но для текущего объема задач людей катастрофически не хватает. Мы ищем инженера по Data Science, программиста iOS c опытом приложений под Mac, backend-программиста (Node.js), продакт-менеджера (мобильные приложения). Также я заинтересован в опытных партнерах, которые помогут выйти на новые рынки, помогут с нишевой экспертизой и снимут с меня часть задач. Управлять компанией со множеством продуктов и сложной технологией в одиночку становится трудно.

Часть команды Lingvanex. Фото из личного архива
Часть команды Lingvanex. Фото из личного архива

Вскоре мы начнем продвижение продукта на рынок. Бюджет на рекламу небольшой — пару тысяч долларов, маркетингом занимается 4 человека. Но для нас этого может быть достаточно: мы используем систему кросс-маркетинга, при которой в одних приложениях рекламируются другие. Это и будет главный источник трафика. Когда я делал тесты разных приложений, была набрана база пользователей более 10 миллионов. Я надеюсь на конверсию порядка 30%.

Основная целевая аудитория — люди, изучающие иностранные языки, туристы и бизнес (где востребован перевод документов). В первую очередь мы нацелены на 6 основных европейских языков — испанский, итальянский, русский, португальский, французский, немецкий. Затем перейдем на азиатские (корейский, японский, китайский). Там рынок еще не такой конкурентный, как в США. При этом самый сложный рынок, на мой взгляд, — именно американский.

Моя цель — 0,5% мирового рынка всех переводов. Процент небольшой, но учитывая, что по прогнозам к 2023 году рынок всех переводов будет $ 70 млрд в год и доля машинного перевода будет расти, он принесет хорошую прибыль для небольшой команды.

Ждать больше невозможно:  я потратил 5 лет и все свои средства. Для запуска все готово, но людей не хватает. И от того, смогу ли я быстро вырастить команду, чтобы доработать переводчик, зависит весь проект. Нас ждет последний рывок. Я шел к этому 12 лет и должен убедиться, что в моей жизни был шанс, и я его не упустил.

Источник