Машин Learning

Алгоритм спам фильтра

Сегодня расскажу об одном из базовых машин лёрнинг алгоритмов — алгоритм спам фильтра. Сам алгоритм может быть реализован разными способами, поэтому сегодня рассмотрим основную идею. Более полную реализацию кода опишу в следующих статьях, поэтому подпишить на мой телеграм канал, чтобы быть в курсе новых статей. Все коды и ноутбуки доступны в моём гите (о jupyter notebooks и git я уже рассказывала).

Git команды для начинающих в Data Science

Всем привет! Один из инструментов, который использует практически любой человек, работающий в IT, это git. Git это программа, которая отслеживает изменения в различных файлах и

Почему компьютер использует 0 и 1?

Я вот недавно задумалась, у многих ли есть понимание почему на уроках информатики нас учат двоичной системе счисления, и как она вообще связана с вычислительной техникой. Если возникли сомнения в ответе на данный вопрос, то эта статья для тебя (бонусом к этой статье идёт игра).

Как увлечь ребенка программированием

Мне кажется достаточно очевидным, что через 10 лет владение каким-либо языком программирования будет такой же необходимостью как знание английского языка сегодня. Вне зависимости от того в какой области и над какими проектами ты работаешь. Поэтому сегодня расскажу о языке Scratch (Скреч), кодить на котором будет интересно не только детям, но и взрослым.

Получить код страницы за 5 минут

Первым этапом в работе с данными является их сбор. Самыми легко доступными и дешёвыми источниками информации являются сайты / веб-странички во всемирной паутине. Поэтому именно этот тип информации является основой многих стартапов.

Юпитер ноутбук, или как начать карьеру аналитика данных

В последнее время позиции Business Analytic, Data Analytic и Data Science крайне популярны. Каждый второй блогер на ютюбе рекламирует курсы по анализу данных как возможность перепрофилироваться и начать работу в сфере IT. В принципе я согласна с тем, что порог вхождения в эту среду достаточно низкий. По моему скромному мнению, человек, способный делать логические выводы и владеющий хотя бы на базовом уровне каким-либо языком программирования, способен найти работу в сфере анализа данных.

Карта интернета

Совсем недавно я задумалась вот над какой вещью. Когда мы совершаем покупки в интернет-магазинах, читаем новости на разных сайтах или просто ищем решение какой-либо проблемы в интернете, наши перемещения по сайтам далеко не хаотичны. В этих перемещениях есть логика. Так вот, я решила проверить, возможно ли составить карту интерната. То есть такую карту, из которой будет понятно как разные сайты связаны между собой.

О манипуляциях с помощью статистики и сексизме

Сексизм часто становится темой вечера и причиной жарких споров в небольшом круге моих друзей. Я вовсе не отношусь к тем людям, которые утверждают, что это надуманная проблема. Но и не особо доверяю статьям с бесконечным числом статистических данных, из которых следует, что сексизм всюду. Сегодня, речь пойдёт о парадоксе Симпсона и манипуляции данными.

Детектор движения

Давненько я ничего не писала. Но у меня есть оправдание :). Во всём виноватa защита докторского минимума и следующий за ней отдых в Австрии (интересное видео из путешествия есть в моём телеграм канале). Теперь спешу порадовать вас новой статьёй. Сегодня мы будем обеспечивать охрану офиса, ведь речь пойдёт о детекции движения.

Как Эйнштейн получил Нобелевскую премию

В данный момент я активно (ха) готовлюсь к защите минимума. Кто учился в докторантуре (аспирантуре), тот понимает о чём я. Для всех остальных: надеюсь, что вы не захотите испытать это на себе :). Ну так вот. Готовиться, понятное дело, мне совсем не хочется. Поэтому, решила написать для вас небольшую статью о Нобелевской премии Эйнштейна. Где-то год назад я прочла биографию Альберта Эйнштейна от Уолтера Айзексона (книга просто супер, всем советую). Всю жизнь я была абсолютна уверена в том, что Эйнштейн получил Нобелевскую премию за теорию относительности. Но как оказалось это совсем не так.

Классификация методом ближайших соседей

Наконец я добралась до машинного обучения. Сегодня поговорим о классификации методом ближайших соседей. Люди, знакомые с машинным обучением (machine learning), чаще называют этот метод kNN алгоритмом (от английского k-nearest neighbors). Надеюсь, простота этого классификатора позволит мне познакомить вас с идеей машинного обучения.

Число Эйлера, или разорится ли банк?

Недавно на просторах википедии встретила мнемоническое стихотворение, позволяющее запомнить чему равно число е: «Экспоненту помнить способ есть простой: два и семь десятых, дважды Лев Толстой». Мне оно так понравилось, что я решила написать об этом числе статью. Сегодня расскажу откуда взялось число Эйлера (более известное как экспонента). И имеет ли Эйлер к нему какое-то отношение.

Задачи для тестировщика

Среди огромного числа IT фирм в Праге есть офис компании Veeam. Последнее время заметила, что ребята как-то очень активно ищут людей на работу. Огромное количество рекламы в соцсетях, разные зазывающие статьи, например, здесь. Судя по всему, дела у них идут не плохо и они активно расширяются, поэтому постоянно ищут работников. Кстати, главный офис у них находится в Питере. Поэтому думаю, что информация будет интересна не только для людей, живущих в Чехии, но и для людей из России.