Технологии
Семантический анализ, Natural language processing, Python, C, Linux, ElasticDB, MySQL, docker.
Заказчик – компания-поставщик анти-спам решений для электронной почты. Команда РЕЛЭКС была привлечена к разработке и поддержке основных модулей продукта, в том числе модуля классификации, обеспечивающего эффективную защиту от нежелательных писем, основанного на ML-алгоритмах.
Нами было спроектировано и разработано ядро системы — сканер (парсер), позволяющий анализировать тысячи электронных писем в секунду.
На основе сканера наши специалисты по AI/ML реализовали ключевые функции: определение языка сообщения, разбор естественного языка, сбор статистики по различным признакам.
Затем мы объединили все ключевые функции в единую ML модель на основе нейронных сетей.
Благодаря ML-алгоритмам разработанный нами продукт обеспечивает высокое качество фильтрации электронной почты, сохраняя производительность на уровне обработки 500 сообщений в секунду с полным анализом содержимого.
Также система позволяет классифицировать разные классы спама: мошеннические письма (phishing, fraud), adult контент, знакомства, новостные и рекламные рассылки и прочие нежелательные письма.
Семантический анализ, Natural language processing, Python, C, Linux, ElasticDB, MySQL, docker.