
参考文献:浅川伸一、江間有沙、工藤郁子、巣籠 悠輔、瀬谷 啓介、松井孝之、松尾 豊『深層学習教科書 ディープラーニング G検定(ジェネラリスト) 公式テキスト』(翔泳社、2018年)
「教師あり学習」とは、「入力と出力の間にどのような関係があるかを予測する手法」です。
「教師あり学習」を簡潔に表現すると、「与えられたデータ(入力)を元に、そのデータがどんなパターン(出力)になるのかを識別・予測する」ものとなります。たとえば、
・過去の売り上げから、将来の売り上げを予測したい。
・与えられた動物の画像が、何の動物かを識別したい。
といった例があります。他にも、
・英語の文章が与えられた時に、それを日本語の文章に翻訳したい。
といったものも、「英語に対応する日本語のパターンを予測する」と考えれば、同様に「教師あり学習」の問題となります。
「何を予測したいか」も2種類あります。
売上を予想したい場合は数字(連続する値)。=連続値を予測する問題のことを回帰問題といいます。
動物の画像の場合はカテゴリー(連続しない値)を予測することになります。=離散値を予測する問題のことを分類問題といいます。
どちらの問題になるかによって、用いる手法が異なるので、注意が必要です。