空気を読まない.データを読む.


ビックデータのAI(人工知能)  AIの研究では,データになりそうなものを集め,5W1Hやユーザの属性,出現頻度などを数えて,同じ(似た)パターンをとる事例どうしを分類する.同じパターンの事例かどうかを判断できるように機械学習(ディープラーニング)させる必要がある.データは数百でも分析できないことはないが,1万以上あるビックデータが良い.数百のデータしかないと,過学習にAIが陥る可能性がある.

 

小中規模データの統計学  統計学を使った研究では,自分の考えにもとづいてデータをとり(見つけ),状況を説明したり(因子分析,共分散構造分析),将来を予測したりする(分散分析).状況を説明するには200以上のデータ,予測するためには,30以上のデータが必要になる.