『Pythonではじめる時系列分析入門』のorg version repoを作ったよ

最近、 馬場 真哉 (著) 『Pythonではじめる時系列分析入門』という本を読みました。 この本はpythonのコードを手で動かしながら時系列分析の基礎を学ぶことができる本で、とてもためになりました。 特にsktimeという、トレンド・季節性の除去などの前処理や予測モデルをsklearnのように簡単にpipeline化できるライブラリを知ることができた点がよかったです。 馬場先生はこの本の公式リポジトリを公開されているのですが、pythonコードがjupyter notebook形式で書かれているため、heavy emacserの私としてはどうしてもorg-modeを使いたくなってしまいました。 そこで、この本のコードをorg-mode形式に変換したリポジトリを作成しました。 リポジトリのリンク このリポジトリを使って、emacsユーザーの方々がこの本を読む際に、jupyter notebookを使わずにorg-modeでコードを実行できるようになればと思います。 特にないと思いますが、このリポジトリを使って何か問題が発生した場合は、pull requestやissueを送っていただけると助かります。 時系列分析勉強中のemacsユーザーは私に感謝したうえで今年のクリスマスは家族と過ごしてください。 読んでいただきありがとうございました。

12月 22, 2024 · 1 分 · B.Kaoru

修論+αの論文がarXivにアップロードされたよ

久しぶりの投稿です。(読んでくれてる人はおそらく一人ですが) 自分の修論にアップデートを加えたものが、arXivにアップロードされました。 論文: Babasaki, K., Sugasawa, S., McAlinn, K. and Takanashi, K. (2024). Ensemble doubly robust Bayesian inference via regression synthesis. (arXiv:2409.06288) この論文では、 マクリン先生が作ったBayesian Predictive Synthesis (BPS)というアンサンブル手法を因果推論、特に平均因果効果(ATE)推定の文脈で拡張し、doubly robust Bayesian regression synthesis という手法を提案してます。 詳しくは論文を読んでもらえるとありがたいです。 この論文を読むうえでは以下の論文を読むことをお勧めします。 McAlinn, K. & West, M. (2019). Dynamic Bayesian Predictive Synthesis in Time Series Forecasting. (Journal of Econometrics 210: 155-169) Sugasawa, S., McAlinn, K., Takanashi, K. and Airoldi, E. A. (2023). Bayesian causal synthesis for meta-inference on heterogeneous treatment effect. (arXiv:2304.07726) この論文は慶應経済学研究科に設定されている計量経済学演習(マクリン先生)の授業を受けた際に書くことになりました。 ...

10月 5, 2024 · 1 分 · B.Kaoru

ベイズの発表をしたよ

こんにちは。 大学のある授業で、中妻先生の名著『Pythonによる ベイズ統計学入門 (実践Pythonライブラリー)』 の 3.1 節までを友達のけいごくんと一緒にスライドにまとめて発表したので、そのスライドを公開します。 発表資料のリンク この資料は emacs の org-mode で作りました。 発表の内容とは関係なく、reveal.js や org-re-reveal の使い方を調べながら試行錯誤するのにとても時間がかかりました。 そのその甲斐あって、 1 番の目的であった、学部生に対してドヤ顔をかますことができました。 今度、暇なときに org-re-reveal の使い方や tips をまとめてみようと思います。 では、また今度。

4月 23, 2023 · 1 分 · B.Kaoru

拝啓 データサイエンティストがいらなくなると思っている君へ

図1: 二十七の僕には誰にも話せない悩みの種があるのです はじめに ここ数年、専門的なホワイトカラーの仕事がAIに奪われるという話を至る所で耳にします。 私自身学部時代から、仕事でも研究でも趣味でもデータサイエンス(以下、DS)にどっぷり浸かってきたのですが、 最近ではテクノロジーに疎い母親や、プログラミング経験のない友人からすら、「まだプログラミングやってるの?」「AIで全部できるんじゃない?」と、悪気なく言われるようになりました。 こうした声は身内だけにとどまりません。 驚くべきことに、名だたる大企業のマネージャーや、コンサルティング業界で長年活躍されてきたような、いわゆるエリートの方々からも、 『DS領域でやっていこうとするのは勧めない』 『データサイエンティストが一番最初にAI に代替される職業なのではないか』 と言われてしまいました。 正直、この状況にちょっとうんざりしています。 彼らはAIが私の仕事を奪う未来を、まるで抗うことのできない「必然」であるかのように語ります1。 しかし、その主張を支える明確な根拠や、自分の経験に基づいた洞察があるわけではありません。 生成AIの最新動向に詳しいわけでもなければ、「なくなる」と言っている職種の中身を理解しているわけでもありません。 大抵ただ、テレビやSNSで聞いた耳障りの良い言葉を、まるで自分の意見であるかのように繰り返しているだけです。 なぜか自信満々に未来を断言するその姿は、まるでLLMのようです。 この風潮は、多くの現場で問題になっているLLMやAIエージェントの負の側面に目を向けずにAIを過剰に業務に導入ことによるリスク2を生んでいるだけでなく、 「AIがなんでもやってくれるから自分は何も学ぶ必要がない」という極端な考え方を助長しているのではないかと危惧しています。 つい先日も、知り合いの優秀な大学院生が「データサイエンティストの将来は暗い」と考え、大学院を中退しようと真剣に悩んでいました。 私は彼らの意見に対して、 図2: それ、本当? と思っています。 ただ、反対だけして理由を言わないのは逃げであり、彼らの主張が正しい可能性もある以上、この状況に向き合う必要があると感じています。 彼等に実際に言われた根拠らしきものに対して、データ分析の現場で働いている者を(勝手に)レペゼンしてアンサーしていこうと思います3。 図3: I’m not a rapper “AI は pytorch のコードを書けるから、データサイエンティストはいらない” これは、有名なコンサルティング会社やファンドを転々としてきたエリートサラリーマンみたいな方に実際に私が言われたことです。 たしかにここ数年、特にコーディングの分野でのAIによる変化は凄まじく、そう思うのも無理はありません。 Tomlinson et al. (2025)が算出しているAI Applicability scores 4では"Data Scientist"はトップ30に入っており5、DSの業務と生成AIとの親和性が非常に高いことを示しています。 過去ブログにも書きましたが、私自身も2022年の終わり頃から生成AIを使っており、コーディングやリサーチ、資料作成や勉強など、様々な場面で恩恵を受けています。 しかしこの 「 生成AIの登場でデータサイエンティストが不要になる 」という考えは 「 PyTorchの登場で、深層学習研究者が不要になる 」と言うのと同じくらい 的外れ なこと6だと思います。 そもそも “データサイエンティストの仕事=コーディング” ではない もともと深層学習の研究者は、多くの時間をハードコアなCUDAコードや誤差逆伝播法のアルゴリズムの実装に費やしていましたが、pytorchやTensorFlowの登場により、そのような低レベルなコーディングの必要がなくなりました7。 では、ニューラルネットワークの研究者は職を失ったのでしょうか? もちろん違います 。 PyTorchなど新しいツールの登場は、本来彼らがする必要のなかった非常に面倒な作業の手間を省き、 研究者がより創造的で本質的な仕事に集中できるようにしました 。 そして2010年台後半の深層学習ブームが生まれ、研究者の需要や価値は下がるどころかむしろ飛躍的に上がったと言えます。 ...

4 分 · Kaoru Babasaki