Описание проекта
Проект посвящен созданию технологии детектирования мошеннических звонков в банковской сфере с использованием искусственного интеллекта (для анализа содержимого диалога, голоса и пр.)
Высокоуровневый алгоритм построен по следующему принципу:
- Специализированное Android-приложение перехватывает все телефонные звонки и анализирует их.
- Для анализа используется потоковый режим Yandex SpeechKit API для преобразования разговора в текстовый вид.
- Для выделения признаков текста проводится модифицированный командой семантический анализ (LSA).
- Производится классификация мошеннических текстов как аномалий на основе метрики между входным и выходным сигналом нейронной сети.
- Если классификация отмечает текст как мошеннический, приложение предупреждает пользователя и/или завершает разговор.
Основной сложностью проекта является формирование датасета. Поэтому нами был разработан специализированный подход к его сборке, а также технические требования к нему. Датасет, исходя из специфики задачи, включает пренебрежимо малое количество мошеннических разговоров, поэтому алгоритм выявляет аномалии или отклонения от нормального. Для сбора мошеннических записей в датасет используется:
- Web crawler - собирающий на видеохостингах тематические видео разговоров со злоумышленниками.
- Введение искусственных мошеннических разговоров посредством собственной имитации атаки.
Область применения: безопасность банковской сферы (коммерциализация посредством модели взаимодействия B2B); борьба с преступлениями (коммерциализация посредством модели взаимодействия B2G).
Внедрение подобного решения в банковское приложение позволит:
- снизить количество жертв мошеннических «колл-центров».
- агрегация статистики правонарушений.
Также приложение может быть доработано и в направлении анализа текстовой переписки в мессенджерах/социальных сетях.