Технология realtime-детектирования мошеннических телефонных звонков, основанная на ИИ

Описание проекта

Проект посвящен созданию технологии детектирования мошеннических звонков в банковской сфере с использованием искусственного интеллекта (для анализа содержимого диалога, голоса и пр.)

Высокоуровневый алгоритм построен по следующему принципу:

Специализированное Android-приложение перехватывает все телефонные звонки и анализирует их.
Для анализа используется потоковый режим Yandex SpeechKit API для преобразования разговора в текстовый вид.
Для выделения признаков текста проводится модифицированный командой семантический анализ (LSA).
Производится классификация мошеннических текстов как аномалий на основе метрики между входным и выходным сигналом нейронной сети.
Если классификация отмечает текст как мошеннический, приложение предупреждает пользователя и/или завершает разговор.

Основной сложностью проекта является формирование датасета. Поэтому нами был разработан специализированный подход к его сборке, а также технические требования к нему. Датасет, исходя из специфики задачи, включает пренебрежимо малое количество мошеннических разговоров, поэтому алгоритм выявляет аномалии или отклонения от нормального. Для сбора мошеннических записей в датасет используется:

Web crawler - собирающий на видеохостингах тематические видео разговоров со злоумышленниками.
Введение искусственных мошеннических разговоров посредством собственной имитации атаки.

Область применения: безопасность банковской сферы (коммерциализация посредством модели взаимодействия B2B); борьба с преступлениями (коммерциализация посредством модели взаимодействия B2G).

Внедрение подобного решения в банковское приложение позволит: