拝啓 データサイエンティストがいらなくなると思っている君へ
図1: 二十七の僕には誰にも話せない悩みの種があるのです はじめに ここ数年、専門的なホワイトカラーの仕事がAIに奪われるという話を至る所で耳にします。 私自身学部時代から、仕事でも研究でも趣味でもデータサイエンス(以下、DS)にどっぷり浸かってきたのですが、 最近ではテクノロジーに疎い母親や、プログラミング経験のない友人からすら、「まだプログラミングやってるの?」「AIで全部できるんじゃない?」と、悪気なく言われるようになりました。 こうした声は身内だけにとどまりません。 驚くべきことに、名だたる大企業のマネージャーや、コンサルティング業界で長年活躍されてきたような、いわゆるエリートの方々からも、 『DS領域でやっていこうとするのは勧めない』 『データサイエンティストが一番最初にAI に代替される職業なのではないか』 と言われてしまいました。 正直、この状況にちょっとうんざりしています。 彼らはAIが私の仕事を奪う未来を、まるで抗うことのできない「必然」であるかのように語ります1。 しかし、その主張を支える明確な根拠や、自分の経験に基づいた洞察があるわけではありません。 生成AIの最新動向に詳しいわけでもなければ、「なくなる」と言っている職種の中身を理解しているわけでもありません。 大抵ただ、テレビやSNSで聞いた耳障りの良い言葉を、まるで自分の意見であるかのように繰り返しているだけです。 なぜか自信満々に未来を断言するその姿は、まるでLLMのようです。 この風潮は、多くの現場で問題になっているLLMやAIエージェントの負の側面に目を向けずにAIを過剰に業務に導入ことによるリスク2を生んでいるだけでなく、 「AIがなんでもやってくれるから自分は何も学ぶ必要がない」という極端な考え方を助長しているのではないかと危惧しています。 つい先日も、知り合いの優秀な大学院生が「データサイエンティストの将来は暗い」と考え、大学院を中退しようと真剣に悩んでいました。 私は彼らの意見に対して、 図2: それ、本当? と思っています。 ただ、反対だけして理由を言わないのは逃げであり、彼らの主張が正しい可能性もある以上、この状況に向き合う必要があると感じています。 彼等に実際に言われた根拠らしきものに対して、データ分析の現場で働いている者を(勝手に)レペゼンしてアンサーしていこうと思います3。 図3: I’m not a rapper “AI は pytorch のコードを書けるから、データサイエンティストはいらない” これは、有名なコンサルティング会社やファンドを転々としてきたエリートサラリーマンみたいな方に実際に私が言われたことです。 たしかにここ数年、特にコーディングの分野でのAIによる変化は凄まじく、そう思うのも無理はありません。 Tomlinson et al. (2025)が算出しているAI Applicability scores 4では"Data Scientist"はトップ30に入っており5、DSの業務と生成AIとの親和性が非常に高いことを示しています。 過去ブログにも書きましたが、私自身も2022年の終わり頃から生成AIを使っており、コーディングやリサーチ、資料作成や勉強など、様々な場面で恩恵を受けています。 しかしこの 「 生成AIの登場でデータサイエンティストが不要になる 」という考えは 「 PyTorchの登場で、深層学習研究者が不要になる 」と言うのと同じくらい 的外れ なこと6だと思います。 そもそも “データサイエンティストの仕事=コーディング” ではない もともと深層学習の研究者は、多くの時間をハードコアなCUDAコードや誤差逆伝播法のアルゴリズムの実装に費やしていましたが、pytorchやTensorFlowの登場により、そのような低レベルなコーディングの必要がなくなりました7。 では、ニューラルネットワークの研究者は職を失ったのでしょうか? もちろん違います 。 PyTorchなど新しいツールの登場は、本来彼らがする必要のなかった非常に面倒な作業の手間を省き、 研究者がより創造的で本質的な仕事に集中できるようにしました 。 そして2010年台後半の深層学習ブームが生まれ、研究者の需要や価値は下がるどころかむしろ飛躍的に上がったと言えます。 ...