A Friendly Introduction to Machine Learning

привет и добро пожаловать в машинное обучение
заглянуть в печаль и смелость, чтобы мы
сегодня говорить о том, что
машина хорошо учится, это мир
и в мире мы добавляем людей, и мы
получили компьютеры и один из основных
различия между людьми и компьютерами
что люди учатся из прошлого
когда компьютеры должны быть
сказал, что нужно программировать так
они следуют инструкциям сейчас
вопрос мы можем получить компьютеры к
учиться на опыте и отвечать
да, мы можем, и это точно с
машинное обучение, конечно,
У компьютеров быстрый опыт есть имя
так что в течение следующих нескольких минут
Я приведу несколько примеров в
которые мы можем научить компьютера тому, как
узнать из предыдущих данных и
важно, я покажу вам, что
эти алгоритмы на самом деле довольно
легко и машинное обучение действительно
нечего бояться, так что давайте перейдем к первому
Например, скажем, мы изучаем
рынок жилья на нашей задаче — предсказать
цена дома с учетом его размера, поэтому
у нас есть небольшой дом стоимостью 70 000 долларов
у нас есть большой дом, который стоит один
сто шестьдесят тысяч долларов и
мы хотели бы оценить стоимость этого
дом среднего размера здесь, так как мы будем делать
сначала положите их в сетку, где
ось x представляет собой размер
дом и квадратные футы и ось y
представляет цену дома и
долларов, и поэтому, чтобы помочь нам, у нас есть
собрал некоторые предыдущие данные в форме
из этих синих точек эти другие
дома, на которые мы смотрели, и у нас есть
зафиксировали их цены в отношении
их размер, поэтому на этом графике мы можем видеть
что малый дом стоит 70 000 долларов
и большой дом по цене сто
и шестьдесят тысяч долларов , так что теперь это
время для небольшой викторины, что вы думаете
это лучшее предположение для цены на
средний дом дал эти данные было бы
тысячи долларов сто
двадцать тысяч долларов или сто
и девяносто тысяч долларов, чтобы помочь
мы можем видеть, что эти синие точки
вид формы линии, чтобы мы могли нарисовать
линия, которая наилучшим образом соответствует данным
теперь в этой строке мы можем сказать, что наши
догадка по цене дома
эта точка здесь , что соответствует
до ста двадцати тысяч
долларов, так что если вы установите сто
двадцать тысяч долларов, что верно
этот метод известен как линейный
регрессии теперь вы можете спросить, как мы
найти эту строку хорошо, давайте посмотрим на
простой пример это три очка мы
попытаемся найти лучшую линию, которая
соответствует этим трем пунктам
очевидно, лучшая линия субъективна, тогда как
мы пытаемся найти линию, которая хорошо работает
так как мы учим компьютер как
это компьютер не может
так что вам нужно заставить его нарисовать
случайную строку, а затем посмотреть, насколько это плохо
это так, чтобы увидеть, насколько плохо
мы вычисляем ошибку, поэтому мы
собираюсь рассчитать ошибку
длины расстояний от
линии к трем пунктам, и мы просто
просто сказать, что ошибка
эта линия представляет собой сумму этих трех красных
Теперь мы собираемся сделать это
передвиньте линию и посмотрите, можем ли мы
уменьшите эту ошибку, допустим, мы переехали
в этом направлении, и мы вычисляем
ошибка дается желтыми расстояниями
мы добавляем их и понимаем, что мы
увеличила ошибку, так что это не хорошо
куда идти давайте попробуем перемещение
в другом направлении мы переместим его сюда
вычислить ошибку, теперь она дается
сумма этих трех зеленых расстояний
и мы видим, что ошибка меньше, поэтому
мы фактически уменьшили его, так что скажем, мы
этот шаг мы немного ближе к
наше решение, если мы будем продолжать это делать
процедуры несколько раз мы всегда будем
быть уменьшая ошибку , и мы будем
наконец, приходят к хорошему решению в
форме этой строки эта общая процедура
теперь известен как градиентный спуск
жизни, мы не хотим иметь дело с негативными
расстояния, соответствующие точке, являющейся
на одной или другой стороне линии, так что
что мы делаем для решения этой проблемы,
квадрат расстояния от точки до
линия вместо этого и эта процедура
называемые наименьшими квадратами
поэтому мы собираемся охватить перепись
пытаясь центральной горы это
наш гора Эверест
hi мы являемся большей ошибкой, так что
нисходящий означает уменьшение ошибки, поэтому
что мы делаем кредит на
кинематографический взгляд на наше окружение
и попытайтесь выяснить , в каком направлении мы можем
спуститься больше, например, здесь мы можем пойти
в двух направлениях вправо или на
левый, давайте пойдем влево, тогда мы
Ошибка при вставке
эквивалентно перемещению линии
вниз и дальше от
три пункта, но если мы пойдем вправо
вместо этого мы фактически спускаемся
что означает, что наша ошибка уменьшает это
эквивалентно перемещению линии вверх
и приблизиться к трем пунктам
поэтому мы решили сделать шаг в сторону или
прямо сейчас мы можем начать эту процедуру
снова и снова, пока мы
успешно спускаться с горы
это эквивалентно уменьшению ошибки
пока мы не найдем его минимальное значение, которое
дает нам лучшую линию, чтобы вы могли
думать о линейной регрессии как о художнике
и будет смотреть на ваши данные и рисовать
теперь лучше всего подходит этот метод
на самом деле намного сильнее, если данные
не образует линию с очень
подобным методом мы можем нарисовать круг
через него или параболу или даже
кривая более высокой степени, например данные
здесь мы можем фактически поместить кубический
Полином хорошо так давайте перейдем к
следующий пример в этом примере мы собираемся
для создания обнаружения спама по электронной почте
классификатор, так что что-то скажет
нас, если письмо является спамом или нет, и как это сделать
мы делаем это, мы делаем это, смотря на
предыдущие данные предыдущие данные 100
электронные письма, на которые мы смотрели уже
эти 100 писем мы отметили 25 из
их спам и 75 из них не спам
теперь давайте попробуем придумать особенности
спам-сообщения могут отображаться и
проанализируйте эти функции, чтобы одна функция
может содержать слово дешевое
Разумно считать , что по электронной почте
содержащий слово «дешево», вероятно,
быть спамом, поэтому давайте проанализируем это утверждение.
искать слово дешево во всех этих 100
электронной почты и найти, что 20 из спама
нагрузки и 5 из не-спама
содержащее это слово, чтобы мы могли забыть о
все остальные электронные письма и фокус
только на те, которые содержат слово
дешево, так что время для викторины здесь
вопрос, основанный на наших данных, если по электронной почте
содержит слово «дешево», что
Вероятность этого спама — это
это 40% 60% или 80% хорошо, чтобы помочь нам
может видеть, что из 25 писем с
слово «дешево» 20 из них является спамом, а
5 из них не являются такими формами 80/20
раскол, поэтому правильный ответ с 80
если вы сказали, что вы были правы, так что
анализируя данные, мы можем заключить
Правило гласит, что если письмо содержит
слово дешевое, то мы собираемся сказать
вероятность того, что он будет спамом, составляет 80%
поэтому мы связываем эту функцию с
вероятность 80%, и мы собираемся
использовать его для обозначения будущих сообщений как спама
или не спам, мы также можем посмотреть на другие
функции и попытаться найти наш Связанный
вероятность предположим, что мы смотрим на электронные письма
содержащие орфографическую ошибку и
осознать, что вероятность электронной почты
содержащая орфографическую ошибку, являющуюся спамом
составляет 70%, или, скажем, мы смотрим на электронные письма
которые не имеют названия и
вероятность те , что спам 95%
и т. д., так что теперь, когда появятся будущие электронные письма
мы можем объединить эти функции, чтобы угадать
их спам или нет, этот алгоритм
известный как наивный алгоритм Байеса в порядке
так что теперь еще один пример — это приложение
Сохраняйте или Google Play , и наша цель состоит в том, чтобы
рекомендовать приложения пользователям, поэтому каждому пользователю
мы попытаемся рекомендовать их
приложение, которое, скорее всего,
скачать, мы собрали таблицу
данные, которые мы собираемся использовать для создания
правила на столе содержат шесть человек
для каждого из шести человек у нас есть
зарегистрировали их пол и их возраст и
приложение, которое они скачали, например,
первым человеком является 15-летняя женщина
и она загрузила золото покемонов так
вот небольшая викторина между полом и
возраст, который кажется больше
решающая функция для прогнозирования того, что приложение
пользователи будут хорошо загружаться, чтобы помочь нам
из первых давайте посмотрим на полу , если мы
разделять их по полу, чем женщины
скачано Pokemon перейдите на whatsapp
тогда как самец загружается Pokemon
пойдите и snapchat так не много для split
здесь, с другой стороны, если мы посмотрим на возраст
мы понимаем, что каждый, кому не исполнилось 20 лет
лет назад загрузил покемон золото
тогда как всем, кому 20 или более лет
не
это хороший раскол, поэтому функция
лучшие расколы данные H поэтому если
вы сказали, что это было правильно, поэтому мы
мы собираемся сделать, мы собираемся добавить
вопрос здесь, вопрос в том, что вы
моложе 20 лет, если да, то мы будем
рекомендую Покемон пойти к вам, если не тогда
мы посмотрим, что произойдет, если вам 20
или старше, тогда мы смотрим на пол
кажется здесь, если вы женщина
вы загрузили то, что было, тогда как если
вы мужчина скачать его Snapchat
поэтому мы добавим еще один вопрос здесь
Вопрос : вы женщина или мужчина и
если вы женщина
мы рекомендуем, что происходит, и если вы
мужчину, то мы рекомендуем snapchat так, что
мы заканчиваем здесь с деревом решений
и решения принимаются
вопрос, который мы задали, и это дерево решений
была построена с данными и теперь всякий раз
у нас есть любой пользователь, которого мы можем поместить в
дерева решений и рекомендовать их
любое приложение, предлагаемое деревом,
рекомендуем, например, у вас есть молодой
человек
вы порекомендуете им Покемона, если вы
иметь пожилого человека, которого вы проверяете
пол, если это женщина, которую вы рекомендуете
их, что случилось, и это мужчина, которого вы
рекомендую им snapchat, очевидно, там
не всегда будет деревом, которое отлично
соответствует нашим данным, но в этом классе мы
изучение алгоритма, который
на самом деле поможет нам найти лучшее
подходящее дерево для вашей таблицы данных в порядке
поэтому перейдем к следующему примеру
теперь предположим, что мы прием
офис в университете, и мы пытаемся
выяснить , какие ученики должны признать
мы будем признавать их или отвергать их
на основе двух частей информации
является вступительным экзаменом, который мы им предоставляем
тест, а другой — их
классы из школы, например, здесь
у нас есть студент 1 с десятками 9
из 10 в тесте и 8 из 10 и
оценки, и этот студент получил
у нас также есть студент 2 со счетом 3
в тесте и 4 в классах и что
ученик не принимался, а затем
новый студент приходит в студент 3 этого
у человека есть сын 7 и 6
и вопрос в том, должны ли мы принять
их или нет
так давайте сначала поместить их в сетку или
ось x представляет нашу оценку на тестах
и ось y представляет их оценки
здесь мы видим, что студент 1 будет лгать
здесь в точке с координатами
9 8, поскольку их баллы составляли 9 и 8 и
студент 2 будет лежать прямо здесь, в
точка с координатами 3 4, поскольку
их баллы составляли 3 и 4, поэтому для того, чтобы
см., следует ли нам принять или отклонить Stu
и 3 мы должны попытаться найти это обучение
эти данные, поэтому мы смотрим на предыдущие
данные в форме всех студентов
мы уже приняты или отклонены и
оказывается, что предыдущие данные
Похоже , это зеленые точки представляют
студентов, которые мы ранее принимали
и красные точки представляют студентов, которые
мы ранее отклонили так
викторина
основываясь на предыдущих данных, мы думаем
студент 3 получает да или нет, поэтому
ответьте на этот вопрос, давайте посмотрим внимательно
при данных красных и зеленых точках
чтобы быть красиво разделенным линией
линия и большинство точек над на
являются зелеными, а большинство пунктов под
он краснеет с некоторыми исключениями, которые
имеет смысл , так как студенты , которые получили
высокие баллы над линией, и они
вскоре получил признание,
оценки находятся под строкой, и они
не получить признание , так что мы собираемся
скажем, что эта линия будет нашей
и теперь каждый раз, когда мы получаем новую
студент, мы проверяем их оценки и сюжет
их на этом графике, и если они
мы прогнозируем, что они
приниматься, и если они оказываются ниже
мы прогнозируем, что они
отклонено, так как ученики 3 имеют оценки
7 и 6 человек окажется здесь на
точка 7 6, которая находится над линией, поэтому мы
пришли к выводу, что это
поэтому, если вы сказали, что это
правильный ответ, этот метод известен как
логистическая регрессия другой вопрос
как вы находите эту линию, которая лучше всего сокращает
данные и — поэтому давайте посмотрим на простой
Пример может служить 6 баллов 3 Зеленый 3 красных и
мы попытаемся нарисовать линию, которая
лучше отделяет зеленые точки от
красные точки и снова компьютер не может
действительно глазной линии, так что вы можете просто
начните с рисования случайной строки, подобной этой
один и учитывая эту строку, давайте просто
случайным образом скажем, что мы обозначаем область
над линией зеленый, а область
под линией красный, так что
линейная регрессия, мы попытаемся
посмотрите, насколько плоха эта первая строка, и
мера того , насколько плоха линия будет
сколько очков мы пропускаем, классифицируя
мы будем называть это число
ошибочная точка указывает на ошибку этой строки
например, неправильно классифицированные две точки один
красный и один зеленый, поэтому мы скажем, что это
имеет две ошибки, которые снова повторяются с линейными
регресс, что мы сделаем, это переместить
линия вокруг
и попытайтесь свести к минимуму количество ошибок
используя градиентный спуск, поэтому я удалил
линии немного в этом направлении мы можем
видеть, что мы начинаем правильно классифицировать
один из пунктов ,
количество ошибок в одном, и если мы переместим
это немного правильнее классифицировать
другая одна из точек , приносящих вниз
количество ошибок до нуля в действительности
поскольку мы используем исчисление для градиента
спуска, выясняется, что
количество ошибок — это не то, что нам нужно
свести к минимуму, но вместо этого
фиксирует количество ошибок называется
логарифмическая потеря функции и идея
функция логарифма потерь заключается в том, что это
функция, которая присваивает большое значение
ошибочные точки и небольшой
ok
давайте посмотрим более внимательно на эту модель
для принятия или отклонения студентов
скажем, у нас есть ученик, который получил
девять в тесте и один по классам
поэтому студент получает принято в соответствии
нашей модели , так как они здесь на
верхней части строки, но это кажется неправильным
так как я студент получил очень низкие оценки, вы
могут приниматься независимо от их
тест был таким, может быть, он упрощен
думать , что это данные могут быть разделены
только одна строка, вернее, реальные данные
должен выглядеть более как это, где эти
студенты здесь
у нас есть оценка нагрузки или низкая
оценки не принимаются, так что теперь
похоже, что строка не будет вырезать данные
в так что следующая вещь после того, как
возможно, круг круга мог бы работать
может быть , две линии , которые могли бы работать слишком
на самом деле похоже, что это работает лучше
так что давайте начнем с вопроса
как мы можем найти эти две строки снова
мы можем сделать это, используя градиентный спуск к
минимизировать аналогичную функцию потери журнала при
это называется нейронной сетью
теперь почему это называется нейронной сетью
хорошо посмотрим, что у нас есть эта зеленая область
здесь и около двух строк эта область
может быть построено как пересечение
а именно пересечение между
зеленая область поверх одной линии и
зеленая зона справа от другого
линий, поэтому
мы собираемся рассчитать это так, как мы.
имеют два узла, каждый узел — это строка, которая
разделяет плоскость на две области и
из двух узлов получаем
пересечение, которое является желаемой областью
причина , почему это называется нейронным
сети, потому что это подражает
поведение мозга в мозге у нас есть
нейроны, которые соединяются друг с другом
и они либо стреляют электричеством, либо не
они напоминают узлы на нашем графике
которые разбивают плоскость на регионы и
электричество огня для данной точки принадлежит
в один из этих регионов и не будет
если это не так, мы не можем объяснить ваши
агрессивность как ниндзя, мы будем смотреть на ваши
данных и сократить его пополам на основе
этикетки, и мы можем думать о нейронном
сеть как команда ниндзя, которая будет
посмотрите на свои данные и разрежьте их на
регионы на основе ярлыков в порядке
так что давайте нырять немного глубже в искусство
разбиения данных на два мы можем посмотреть
в этом случае три зеленых и три красных
и, похоже, есть много строк, которые могут
разбить их, например, есть это
желтая линия и есть этот фиолетовый
лайн, чтобы проверить, какая из этих двух строк
athing сокращает данные лучше фиолетового
или желтой, если мы посмотрим на
желтая линия кажется, что она близка к
если он слишком близко к двум
так что, если мы будем шевелиться
немного мы пропустим классификацию некоторых
точек фиолетовый один на
другая рука, кажется, хорошо разнесена и
насколько мы можем со всех точек
кажется, лучшая линия — фиолетовый
вопрос в том, как мы находим
фиолетовая линия хорошо первая
наблюдение состоит в том, что мы на самом деле не нужны
беспокоиться об этих моментах, потому что
они слишком далеко от границы, поэтому мы
может забыть о них и сосредоточиться только на
точки, которые близки, и теперь что
мы будем использовать не градиент
спуск, но мы будем использовать линейные
оптимизации, чтобы найти строку, которая
максимизирует расстояние от границы
указывает, что этот метод называется поддержкой
векторная машина
поэтому вы можете думать о поддержке вектора
машины , на которых хирург увидит ваши данные
и разрезать его, но прежде чем она будет осторожна
Посмотрите, что лучше всего отделить
данные в, а затем сделать разрез в порядке
так что теперь скажем, что у нас есть эти четыре
точек, расположенных таким образом, и мы хотим
разделите их, кажется, что строка не будет
с тех пор, как они уже прошли
линия, а красные — по бокам
а зеленые — посередине, поэтому
нам нужно думать вне коробки в одну сторону
думать нестандартно — использовать
кривой, подобной этой, чтобы разделить их на другую
на самом деле нужно думать за пределами
простой и думать о точках
лежащих в трехмерном пространстве, поэтому
здесь находятся точки над плоскостью и
здесь мы добавим дополнительную ось оси z для
третьего измерения, и если мы сможем найти
способ поднять его до зеленых точек, тогда мы
быть в состоянии отделить их с плоскостью, чтобы
то , что кажется лучшим раствором
кривая здесь или плоскость здесь
хорошо, оказывается, что эти два
на самом деле тот же метод не волнуется, если
это кажется запутанным, мы войдем в
немного позже, позже этот метод
называется ядром трюк как очень хорошо
используется в машинах с поддержкой векторов, поэтому давайте
изучите один из них более подробно, давайте
начните с трюка кривой, так что давайте
начать ввод координат на
указывает, что это точка нуля три
это 1 2 это один 2 1 и это
один — 3 0, и нам нужен способ
отделить зеленые точки от красного
точек, поэтому координаты точек XY
то нам нужно уравнение на
переменные x и y, которые дают нам большие
значения для зеленых точек и малых
значения для красных точек или наоборот
так что викторины, которые из следующих уравнений
может прийти нам на помощь
X плюс y произведение x раз y
или x квадрат первых координат
квадрат это непростой вопрос
поэтому давайте фактически сделаем таблицу с
значения этих уравнений на каждом из
четыре пункта, поэтому вот наша таблица здесь
имеют четыре точки в верхнем ряду и
теперь каждая из других строк будет одной
функций, так что вот сумма X
плюс y, мы заполняем первую строку
следующим образом 0 плюс 3 равно 3 1 плюс 2
3 2 плюс 1 3 3 плюс 0 3 теперь для
второй ряд мы собираемся , чтобы получить
продукты 0 раз 3 равно 0 1 раз 2 равно 2 2
times 1 равно 2 и 3 раза 0 равно 0 и для
третья строка x квадрата является первой
квадрат так, чтобы квадрат 0 составлял 0 1
квадрат 1 2 квадрата 4 и 3
квадрат равен 9, поэтому давайте подумаем, какой из
эти уравнения отделяют зеленый и
красные точки мы смотрим на сумму X плюс
y, и это дает нам 3 при каждом значении, поэтому
он действительно не разделяет точки, которые мы
может смотреть на квадрат х, и это дает нам
разные значения для каждой точки, но мы
получите 0 & 9 для красных значений и 1 & 4
для зеленых, так что это тоже
не отделяют их, но теперь мы
посмотрите на продукт x раз y и что
дает 0 для красных значений и 2 для
зеленых, чтобы кто-то вроде
работа правильная, это функция, которая может
рассказать им обособленно, так что это уравнение
мы будем использовать, вы можете увидеть их
продукты здесь и сейчас для красных точек
X запятой Y имеем , что произведение X y
равно 0, а для зеленых точек мы
что произведение X y равно 2 и
что отделяет 0 и 2 лунки a 1 так
уравнение xy равно 1, будет разделено
их
и что такое XY равно одному, это одно и то же
поскольку y равно единице над X и график для
y было 1 над X, именно это
гипербола здесь, то есть кривая we
хочу, чтобы это было трюком ядра
мы также можем увидеть это в 3d здесь.
точка 0 3 1 2 2 1 и 3 0, и мы
рассмотрим их в 3-х местах, поэтому
мы собираемся взять карту, которая берет
точка X запятая Y 2 X запятая Y запятая X
times y, где 0 3 go 0 3 идет в
0 запятая 3 запятая 0, так как произведение 0
& 3 — 0 1 2 — 1 запятая 2 запятая 2
поэтому он идет полным путем, поскольку
третья координата — это высота точки
2 1 также относится к 2 запятым 1 запятая 2 и
точка 3 0 переходит в 3 запятые 0 запятой 0
поэтому мы идем, мы можем разбить их, используя
чтобы вы могли придумать поддержку
векторная машина — метод ядра как
хирург, который немного смущен
пытаясь разделить некоторые яблоки и апельсины
вдруг она приходит с
отличная идея , идея заключается в перемещении
яблоки и апельсины вниз и
затем успешно разрезать линию через
между ними нормально, поэтому давайте переместим следующий
Например, предположим, что у нас есть цепочка
пиццерии, и мы хотим поставить 3 из
их в этом городе, поэтому мы делаем исследование и
поймите, что люди, которые едят кусок
большинство из них живут в этих местах и поэтому
нам нужно знать, где оптимальные
места для размещения наших 3-х пиццерий
кажется, что дома красиво
разделить на три группы: красный синий
и желтый , так что имеет смысл ставить
одна пиццерия в каждом из
три группы , но мы преподающих
компьютер, как это сделать, компьютер может
просто глазное яблоко — три кластера, которые нам нужны
алгоритм, так что вот один алгоритм
это сработает
давайте начнем с выбора трех случайных
места для салонов пиццы, поэтому
они здесь, где звезды расположены
красный синий и желтый теперь имеет смысл
сказать, что каждый дом должен пойти в пиццу
салон , который находится ближе всего к нему в том , что
случай мы можем посмотреть на карту, как это
где желтые дома идут на желтый
пиццерия синие дома идут в
синий пиццерий и красные дома идут
в красную пиццерию, но теперь посмотрим на
где желтые дома расположены вам
будет иметь большой смысл перемещать
желтый пиццерий в центр
эти дома одинаковы с синим
дома и красные дома, давайте сделаем
что давайте переместим каждую пиццерию в
центр домов, который он обслуживает
следующим образом, но теперь посмотрим на эти синие
указывает есть гораздо ближе к
желтый пиццерий, чем синий
поэтому мы могли бы также окрасить их в желтый цвет
и посмотрите на эти красные точки, которые они
ближе к синим битам цвета, затем
красный, поэтому давайте окрасим их в синий цвет и теперь
давайте сделаем шаг еще раз ,
пиццерия в центр этого
дома , которые служат в этом пути , но
то опять посмотрите на этот красный дом.
там гораздо ближе к синей пицце
салон, поэтому давайте превратим их в синий, а затем
снова давайте переместим каждую пиццерию в
центр дома , поскольку это служит и
теперь мы достигли оптимального решения, поэтому
начиная со случайных точек и
повторение этого процесса помогло нам достичь
лучшие места для пиццерий
этот алгоритм называется k-средством
кластеризации, но теперь давайте просто скажем, что мы
не хочу , чтобы указать количество
кластеров, чтобы начать с
по-разному, чтобы сгруппировать дома, так скажите
они устроены так, как будто это
смысл сказать следующее, если два дома
близки, они должны обслуживаться
такой же пиццерий, поэтому, если мы пойдем этим
правило, давайте попробуем сгруппировать дом
давайте посмотрим , на которых дома есть
ближе друг к другу, эти два
здесь
поэтому мы сгруппировали их теперь, каковы следующие
два ближайших дома — эти два
Вот
поэтому мы сгруппировали их в ближайшие два ближайших
дома — эти два, и мы снова сгруппировали
их следующие две ближайшие снаружи — две
поэтому мы объединяем группы в следующие два
дом здесь, поэтому мы сгруппировали их
следующие два кластера здесь, поэтому мы присоединяемся
группы следующих двух ближайших домов
здесь, но теперь давайте просто скажем, что это
слишком большой, поэтому все, что нам нужно сделать, это указать
расстояние и сказать, что это расстояние тоже
далеко, когда вы достигнете этой дистанции
группируя дома, и теперь мы получаем
кластеры этот алгоритм называется здесь
кластеризация статей так поздравления
В этом видео мы узнали многие из
основные алгоритмы машинного обучения мы
научитесь находить цены на жилье, используя
линейной регрессии мы научимся обнаруживать
спам- адрес электронной почты с использованием наивных байесов мы учимся
рекомендовать приложения с помощью деревьев решений
научиться создавать модель для
приемная служба с использованием логистики
регрессии мы узнаем, как их улучшить
используя нейронные сети, и мы узнаем, как
улучшить его еще больше , используя поддержку
и наконец мы узнаем, как
найти пиццерии вокруг города
с использованием алгоритмов кластеризации
вопросы могут возникать в вашей голове, такие как
есть ли еще алгоритмы ответа?
да, какие из них использовать нелегко
учитывая набор данных, как мы знаем, какие
алгоритм, чтобы выбрать, как их сравнивать
и оценивать их как алгоритмы
вы знаете, какой из них лучше, чем
другой набор данных, заданный
время их точности и т. д.
примеры других проектов являются реальными
эти данные, что я могу испачкать руки
с ними ответ на все эти
вопросы больше или в Udacity
машина изучает нанодегрессию, поэтому, если это
вас интересует, вы должны взглянуть на
он благодарит вас

Английская версия

Please follow and like us:

Be First to Comment

Добавить комментарий Отменить ответ