クロスバリデーションとは? 前回は予測モデルを構築しました。しかし、モデルを作るのに利用したデータと、精度を計測するデータが同じになってしまうため、「予測がどのくらい正確にできているか」がわからないのが問題でした。 本番における精度がどの程…
★この記事で利用するサンプルコードは、こちらで確認できます。 モデル構築ライブラリ「scikit-learn」とは? ロジスティック回帰の概要を第7話で紹介しました。ロジスティック回帰とは、簡単にいうと、データが与えられたときにAかBのどちらに属するのかを…
第5話と第6話では、データの集計と可視化を実践しましたね!今回から、 いよいよ機械学習に入っていきましょう! 未知の事象を予測する! ロジスティック回帰ってなあに? いよいよ機械学習について学んでいきましょう。機械学習には多種多様な手法がありま…
前回の続き:第5話 集計と可視化:pandasでデータの加工をしてみよう 第5話では、pandasを使ってデータを加工する方法を紹介しました。今回は、加工したデータをグラフにすることで、データの傾向をとらえてみましょう! 今回のサンプルコード サンプルコー…
サンプルデータをダウンロードしよう 当記事で利用するデータセットはこちらのサイトからダウンロードできます。 コードはこちらに掲載しています。 「Data Folder」をクリックし、次のページで「Online Retail.xlsx」をクリックすることで、データをダウン…
データを使える状態にする「前処理」って何? 前処理は、第1話で紹介した CRISP-DM において、ビジネス理解、データの理解、データの準備の3ステップにあたります。 STEP1.ビジネス理解 まずは、ビジネス理解についてです。解決したい問題設定におけるビジネ…
私たちの日常にも、データ活用や機械学習が活かされているんですね! 現実世界で「機械学習の技術」は、どのように活かされているの? マーケティング領域ではデータ活用が進んでいます。マーケティング職や、ウェブ、アプリ開発の仕事をされている方は、機…
人工知能、機械学習、ディープラーニングの違い 人工知能という言葉の定義はむずかしい 人工知能という言葉の定義はむずかしいと言われています。「人工」という言葉には「人間と機械を区別する基準は何か?」という問いが生まれます。「知能」という言葉に…
(出典)https://papers.nips.cc/paper/2015/file/86df7dcfd896fcaf2674f757a2463eba-Paper.pdf ・Configuration:設定 機械学習システムに必要な設定をする・Data Collection:データ収集 機械学習するためのサンプルデータを集める・Data Verification:デ…