Новые технологии: Фильтрация смс спама с помощью наивного байесовского классификатора (код на R) @habrahabr

вторник, 25 июня 2013 г.

Фильтрация смс спама с помощью наивного байесовского классификатора (код на R) @habrahabr

Привет. В этом посте мы рассмотрим простую модель фильтрации спама с помощью наивного байесовского классификатора с размытием по Лапласу, напишем несколько строк кода на R, и, наконец, протестируем на англоязычной базе данных смс спама. Вообще, на хабре я нашел две статьи посвященные данной теме, но ни в одной не было наглядного примера, чтобы можно было скачать код и посмотреть результат. Также не было упоминания про размытие, что существенно увеличивает качество модели, без особых затрат усилий, в отличие, скажем, от сложной предобработки текста. Но вообще, запилить очередной пост про наивного байеса меня побудило то, что я пишу методичку для студентов с примерами кода на R, вот и решил поделиться инфой.

Читать дальше →

via Хабрахабр / Захабренные / Тематические / Посты http://habrahabr.ru/post/184574/

Новые технологии

Поиск по этому блогу

вторник, 25 июня 2013 г.

Фильтрация смс спама с помощью наивного байесовского классификатора (код на R) @habrahabr

Комментариев нет:

Отправить комментарий

вторник, 25 июня 2013 г.

Фильтрация смс спама с помощью наивного байесовского классификатора (код на R) @habrahabr

Комментариев нет:

Отправить комментарий

вторник, 25 июня 2013 г.