Привет, меня зовут Ведант Матур, и в этом блоге я расскажу вам о своих поисках и исследованиях в революционной области искусственного интеллекта (ИИ), машинного обучения и больших данных.

В мире, столь окутанном и увлеченном технологиями, как наш, существует множество технологических инноваций, которые захватывают умы и сердца людей, но среди них выделяется одна область. Одна область, чьи амбиции уступают только ее потенциалу, растет с непостижимой скоростью и призвана отметить рассвет новой эры. Это поле — искусственный интеллект.

Как область, искусственный интеллект исследует и углубляется в самые основы нашей психологии и философии, работая над формулированием того, что классифицируется как интеллект, а что нет. Загадка того, как определить, когда компьютер действительно может «думать», — это вопрос, который мучает даже величайших компьютерных ученых и философов, и по мере того, как мы приближаемся к четкому ответу на этот вопрос, мы можем, наконец, открыть новую волну технологии — Smart Computers.

В то время как многие программы, с которыми мы сталкиваемся в наши дни, маскируются под «использующие» ИИ, в самом чистом смысле искусственный интеллект имитирует и отражает наши когнитивные функции.

Теперь, как область, ИИ огромен. Все, от науки о данных до машинного обучения и обработки естественного языка (NLP), все подпадает под всеобъемлющее понятие искусственного интеллекта. И поэтому в этом смысле ИИ на самом деле не является полем. Это семя, которое проросло на других полях.

Итак, когда я исследовал бесконечные области искусственного интеллекта, одна область в нем действительно выделялась для меня — машинное обучение. Чем больше я читал об этом, тем больше меня это зацепило. Сама мысль о том, чтобы научить компьютер «учиться» и думать почти независимо, по-настоящему озарила мой разум. Я думал о бескрайних просторах такого поля; последствия машинного обучения проникают в медицину, оборону, финансы и многое другое. Поэтому я понял, изучая ИИ, область, которая действительно охватывает и принимает близко к сердцу понятие независимого «мышления», на самом деле является машинным обучением.

Так как мое сердце было настроено на машинное обучение, я начал исследовать фундаментальные вопросы, на которых оно основано. Меня осенило, что для того, чтобы действительно добиться какого-либо успеха в машинном обучении, мы должны сначала решить основной вопрос: как определить «обучение»? И по мере того, как мы углубляемся в этот вопрос, становится все яснее и яснее, что область ИИ имеет столько же общего с философией, сколько и с вычислениями; чтобы попытаться качественно изложить, что значит «учиться», требуется серьезное исследование нашей собственной психологии. К счастью, Том М. Митчелл, известный американский ученый-компьютерщик, кажется, оказался на вершине, предложив формальное определение того, что включает в себя машинное обучение:

Говорят, что компьютерная программа обучается на основе опыта E с уважением к некоторому классу задач T и мера производительности P, если ее производительность при выполнении задач в T, измеряемая P, улучшается с опытом E.

На первый взгляд это может показаться загадочной и бессвязной мешаниной слов; в конце концов, он бросил нам некоторые термины, такие как «опыт E» или «показатель производительности P», которые сейчас могут показаться нам чуждыми, но со временем эти концепции постепенно войдут в ваше сознание и закрепятся в фундаментальных идеях Машины. Обучение.

Чтобы лучше проиллюстрировать, что именно пытался сообщить Мичелл в своем информативном, но загадочном заявлении, я приведу пример, в котором все эти иностранные термины будут лучше освещены.

Пример проблемы — классификация опухолей как доброкачественных или злокачественных

Допустим, нам предоставлены данные, которые сравнивают размер опухоли с тем, является ли она доброкачественной (несмертельной) или злокачественной (потенциально смертельной). Так, например, у нас может быть опухоль размером 2 мм, и это соответствует ее доброкачественности.

Можем ли мы, как компьютерщики, использовать практику машинного обучения, чтобы на самом деле учиться на этих данных и быть в состоянии предсказать, является ли данная опухоль доброкачественной или злокачественной.

Теперь давайте сделаем несколько шагов назад и вернемся к определению компьютерного обучения Тому М. Митчеллу. Он сослался на задачу T, которая в данном случае будет предсказывать состояние опухоли (то есть доброкачественная или злокачественная). Затем он сослался на опыт E, который в данном случае просто намекает на данные, которые мы передаем алгоритму. Наконец, мера производительности — это просто средство для оценки успешности и точности алгоритма.

Таким образом, по сути, чтобы компьютер «обучался», его показатель производительности должен повышаться по мере того, как мы вводим больше данных. Если мы займемся этим понятием в рамках этого примера, точность прогнозов должна становиться все более точной по мере того, как мы будем вводить больше данных о размерах и состояниях опухолей.

Если это так, то поздравляем, у вас есть рабочая часть программного обеспечения для машинного обучения!

Я надеюсь, что из этого примера вы все смогли лучше понять, в чем суть машинного обучения. В дополнение к тому, как он предлагает объяснение формального определения Митчелла, он также тонко демонстрирует неоспоримый охват этой области. В этом случае мы увидели, как можно использовать машинное обучение, чтобы действительно помочь классифицировать опухоли как доброкачественные или злокачественные, что в реальном мире невероятно важно, и показывает, как эта область может действительно спасать жизни.

Так что это все для этого поста. В моем следующем я буду углубляться в две «большие» ветви машинного обучения — обучение с учителем и обучение без учителя.

Спасибо за чтение!