Сегодня расскажу об одном из базовых машин лёрнинг алгоритмов — алгоритм спам фильтра. Сам алгоритм может быть реализован разными способами, поэтому сегодня рассмотрим основную идею. Более полную реализацию кода опишу в следующих статьях, поэтому подпишить на мой телеграм канал, чтобы быть в курсе новых статей. Все коды и ноутбуки доступны в моём гите (о jupyter notebooks и git я уже рассказывала).
Рубрика: #аналитика в песочнице
Git команды для начинающих в Data Science
Всем привет! Один из инструментов, который использует практически любой человек, работающий в IT, это git. Git это программа, которая отслеживает изменения в различных файлах и
Получить код страницы за 5 минут
Первым этапом в работе с данными является их сбор. Самыми легко доступными и дешёвыми источниками информации являются сайты / веб-странички во всемирной паутине. Поэтому именно этот тип информации является основой многих стартапов.
Юпитер ноутбук: настраиваем ядро (кернел)
Сегодня хочу рассказать вам о том, как начать и упорядочить работу в Юпитер ноутбуке (о том что такое Jupyter Notebook можете прочитать здесь).
Юпитер ноутбук, или как начать карьеру аналитика данных
В последнее время позиции Business Analytic, Data Analytic и Data Science крайне популярны. Каждый второй блогер на ютюбе рекламирует курсы по анализу данных как возможность перепрофилироваться и начать работу в сфере IT. В принципе я согласна с тем, что порог вхождения в эту среду достаточно низкий. По моему скромному мнению, человек, способный делать логические выводы и владеющий хотя бы на базовом уровне каким-либо языком программирования, способен найти работу в сфере анализа данных.