
Привет. В этом посте мы рассмотрим простую модель фильтрации спама с
помощью наивного байесовского классификатора с
размытием по Лапласу, напишем несколько строк кода
на R, и, наконец, протестируем на англоязычной
базе данных смс спама. Вообще, на хабре я нашел две статьи посвященные данной теме, но ни в одной не было наглядного примера, чтобы можно было скачать код и посмотреть результат. Также не было упоминания про размытие, что существенно увеличивает качество модели, без особых затрат усилий, в отличие, скажем, от сложной предобработки текста. Но вообще, запилить очередной пост про наивного байеса меня побудило то, что я пишу методичку для студентов с примерами кода на R, вот и решил поделиться инфой.
Читать дальше →via Хабрахабр / Захабренные / Тематические / Посты http://habrahabr.ru/post/184574/
Комментариев нет:
Отправить комментарий