ぽんぽこ日記

このブログはタヌキによって書かれています

【ざっくり紹介】秘書問題について

Calendar for データ構造とアルゴリズム | Advent Calendar 2021 - Qiitaの14日目の記事です。

秘書問題について

目的
1番いい秘書を雇いたい
条件
* 秘書を1人雇いたい。
* N 人と面接する。
* 無作為な順序で1人ずつ面接を行う。次に誰を面接するかは常に同じ確率である。
* 面接した瞬間に採用するかどうか決めないといけない。(キープはできない)
* 不採用にした応募者を後から採用することはできない。

小ネタ

別名、結婚問題 (marriage problem)と呼ばれます。
最近周りが結婚ラッシュで、どうしたら理想的な結婚相手が見つかるかなと思い調べたのがキッカケです。

最適戦略

Nが十分大きい時、k番目まで見送り、k+1番目から「今までで1番評価が高い人」が現れたら採用する。
この時、最善の応募者を選択する確率は 1/eとなる。

証明はこちら

最近の研究

k秘書問題

上記で、紹介したのは採用する人数が1人の場合である。それを複数にしたver。
k秘書問題は前からあったが、アルゴリズムの厳密性を争点としてる。 www.sciencedirect.com

ロバストに解こう

無作為な順序で1人ずつ面接を行う。次に誰を面接するかは常に同じ確率である。
という条件を意地悪な順番だったらどうするの?というアプローチ

arxiv.org

お詫び

本当は研究の論文の方を紹介したかったのですが、力尽きました。すみません...

自分流英語勉強メモ

例文検索

  - Hyper Collocation
https://hypcol.marutank.net/ja/
 - Ludwig
  https://ludwig.guru

発音検索

  - YouGlish(YouTube動画から単語・フレーズを検索)   https://youglish.com
  - Forvo
  https://ja.forvo.com

シャドーイング

Writing

  • Grammaly

【ザックリ論文】Dynamic Metric Learning: Towards a Scalable Metric Space to Accommodate Multiple Semantic Scales

CVPR2021で面白そうな論文を見つけたのでザックリまとめてみました。
Dynamic Metric Learning: Towards a Scalable Metric Space to Accommodate Multiple Semantic Scales

Introducing MLOps: How to Scale Machine Learning in the Enterprise を読みました

f:id:nanay_desu:20210412232215p:plain
Introducing MLOps: How to Scale Machine Learning in the Enterprise (English Edition) 1st 版 https://www.amazon.co.jp/dp/B08PDW3JLY

サクッと読むにはちょうどいい量。業務後の時間を使って、1.5日くらいで読めました。

構成

3部構成になっている。
1部「MLOps: What and Why」ではMLOpsの定義となぜ必要なのか。
2部「MLOps: How」ではどのようなことをMLOpsでは考慮しなくてはならないのか?。
3部「MLOps: Real-World Examples」で実例。

雑感

1部の内容は機械学習をやっている人ならばそんなに大きな情報はないかもしれない。タイトルの通り、おそらく機械学習をやっていないソフトウェアエンジニア向けの内容でした。 個人的には2部の内容がよかった。機械学習屋が感じている課題を列挙しているのが非常に良いと感じた。(知っている内容もあるけど、意外と抜けている内容もあった。)

「MLOps?なにそれ美味しいの?」って人にはいい本だと思う。ただ、ある程度MLOpsをやったことがある人にとっては物足りない内容かもしれない。

個人的には以下の章が面白かった。

  • Chapter 5. Preparing for Production
  • Chapter 6. Deploying to Production
  • Chapter 7. Monitoring and Feedback Loop
  • Chapter 8. Model Governance

興味のある学会リスト-自分用

チェックしたい学会を表にしてみた。随時更新する予定。

分野 学会 大体の開催時期
理論系 AISTATS 2〜5月
web系 WWW 5月
画像系 CVPR 6月
ML ICML 6〜8月
Data Minig KDD 7〜8月
Data Minig ICDM 7〜8月
ML IJCAI 7〜8月
NLP ACL 7〜8月
Database VLDB 8〜9月
推薦 RecSys 9月
画像系 ICCV 10月
Neural系 NeurIPS (NIPS) 12月

便利な画像

f:id:nanay_desu:20210403180152p:plain

www.kamishima.netより引用