夏休み 29日目

今日は10時半起床。某会議を自然に寝飛ばす。

  • 2時に床屋で散髪。3時から別の説明会。
  • コロナの話をしようとしたが、アドバイザリーボードの資料がまだ出ていなかった。モニタリング会議は出ていて、だいたいステージ III になりつつあるね、という話だった。
  • Chrome で pdf を開くことができなくなってしまった……。シークレットモードならいけるがかなり面倒だなぁ。
  • 履歴とか Cookie を全部消し飛ばして全部開き直したら見れるようになった。が、履歴を消し飛ばしたのを後悔している。
  • 感染者数まわりだけでも書いておくか。
    • 東京都の状況が 18 日目に述べたときからどのくらい改善したか。
    • まず感染者数は上々。休日が多かったとはいえ 250 人くらいというのはすごい。多分これですでに第4波直後の状況をほぼ達成している。まだ減少トレンドは続いているっぽいので 200 人後半をコンスタントに達成するのは遠くはなさそう。期待。
    • 陽性率は早くも 5% 台に突入。減少傾向が持続しているしなかなか良い感じになっているな。
    • 重症患者数は減りが鈍くてまだ 139 人。そういえば第3波が終わらないうちに第4波が来たんだった。まあでも想定よりは早い気がする。10 月上旬もいけそう。
    • 入院患者数は派手に減って 1725 人。あと1週間くらいしたら 1200 切ってそう。
  • そういえば接種率について、高齢者のものを政府ポータル(CIO)で見るとわかるのだが、 80% くらいで停滞し、最終的にようやく 90% に到達という流れになっている。
  • 若年層は高齢者より寝たきりなどワクチン対象外の人が少なそうなので、もう少しいけそうな気はするが、必要性が低い人もいるのでどう出るやら。
  • まあ 80% まで今のペースを維持すると期待するなら、全人口分母で 75% くらいまではいける計算になるみたい。う~んどうだかなぁ。

夏休み 28日目

  • 11 時起床。DB もバイトもやってねえ……。
  • ユニクロで服を買う。
  • 17 時から久々にオンラインゼミ。スペクトル分解。
    • 有界自己共役作用素を極分解したときの絶対値パートもまた自己共役になることが示せなくてプチ炎上した。
    • それ以外は自明なパートが多い。ただ、次回がめっちゃ難しいパートなのでどうしたものか。単位の分解とスペクトル測度が等価になることを示すところ。死ぬ。
  • ワクチンの話。
    • 18 日目のやつを確認。
      f:id:le_livre_blanc:20210924152054p:plain
      そろそろ日本が接種率を上回りそうな国(人口 100 万以上)の最近の動向
      f:id:le_livre_blanc:20210924152142p:plain
      上の図にある国の1回目の接種率(多くは9月22日時点)
    • という感じで、割といいところまで来てはいる。ここで古瀬さんの研究とかを振り返ると、ほぼ「ありうるシナリオ」を達成していることが再確認できる。(高齢者が 10% 多い分、他の年代の接種率が低くて済むように計算してしまっている気がするが、まあ)
    • 「目標となるシナリオ」は、トータルの接種率が 73~74% くらいになればほぼ達成できていたとみなしてよさそう。暗算で計算しただけなので間違っているかもしれない。
    • 職域が 70 万回/週まで落ちていたし、今は多分 100 ~ 110 万回/週くらい。このペースを維持しても1回目接種で上記目標を達成するには 10 月上旬いっぱいくらいはかかりそう。9月末で 74% という予想は外れたわけだ。
    • 寝る直前に少しだけ『線型作用素のスペクトル』を読んだ。複素解析が威力を発揮してくれるパートだった。

夏休み 27日目

今日は珍しく 10 時起床。

  • 大学の ebook ライブラリを流し見していたら、伊庭先生の絶版のやつ(計算統計2)が入っていた。すごい。そのうち流し読みしたいな。
  • なんだか今日はブログを書く気が起きなくて翌日にだらだらと書いている。
  • 何をしたかな。
  • 床屋の予約を取りに行くのに時間がかかった。明後日午後。
  • その後、ふらふらと本郷まで出かける。どこで食ったんだっけ。ロッテリアで食べたのは覚えている。
  • 明日のゼミが終わっていないことに気づくが、予習は後回し。
  • 帰りに買った『かがみの孤城』はすぐ読み終わってしまった。
    • 下巻の最初の方で見当がついたので勝ち。しかし伏線は1箇所だけ見逃したのが悔しい。○○が重要なキーワードだということに気づいていたのならそれに係る描写に注意するくらいはするべきだったなぁ。
  • ワクチンの話を書く。
    • 職域が最盛期の半分くらいのペースになっていた。多分最終的には1回目、2回目がともに1千万回ちょいくらいで終わりそう。
    • まあ職域の目的は大方達成されたと言えるし、現状はおそらく古瀬さんの予測で「ありうるシナリオ」くらいまでは来ているので良しとはしたい。
    • あと2週間くらいこのペースを維持することができれば、全人口での接種率が 73 とか 74 行って「目標となるシナリオ」をほぼ達成するのだが、なんとなくこれを達成したころには息切れしていそう。
    • ペースダウンの兆候は職域を見るまでも無く見えていて、明確にグラフに現れるのも時間の問題。あと1週間くらいかねえ。
    • まあ 75% を達成できれば悪いってことは無いとは思うが、どうせならポルトガルにせまる 80% くらいで停滞してほしいと感じる。厳しいかねえ。

夏休み 26日目

今日は 12 時起床。まあ3時半まで DB やってたしこんなもんでしょう。

  • そろそろ 夏休み 18日目 - ねこ. にある↓ ourworldindata.org

  • を見て楽しみたいが、日本の更新が 16 日で止まっているのでまだあまり楽しくない。

    • 追記:21時頃に見たら出てた。多分 19 時とかそのくらいに更新している。
  • バイトを立て続けに片付けた。とてもえらい。
  • 月曜の感染者数がやたら少ない(302名)のはまあはい。今日も月曜が敬老の日だった影響で少なかったんだろうし、水曜が本番かな。何の影響も無い祝日でこれくらいならもう第4波後の安定期と同レベルなんだけどなぁ。
  • 有本カルマンをフィルターの構成まで読んで終わり。
    • 問題の定式化までは追いかけて、あとは帰納的に最小二乗不偏推定量を構成できれば終わりというところまで来た。
    • ところで、行列 A_k が∀正則であれば信号の分散行列 X_{k+1}:=A_kX_kA_k^\top+B_kU_kB_k^\top は常に正則であるという主張があるが、これは嘘っぽい。
    • A_kX_kA_k^\top は常に正定値になるので常に正則までは言えるが、B_kU_kB_k^\top (U_k は正定値対称行列)は正則とは限らない(∵B_k がフルランクとは限らないので)。
    • 多分可制御性より少し弱い条件を暗黙のうちに仮定してしまっているのではないかと思われる。
    • てかこれ証明を略すほど難しくないと思うんだよな。載せろや。
  • 急に目眩がしたので1時過ぎくらいには布団に入って2時過ぎに寝た。良性〜〜めまい症あたりを疑うべきか?疲れ?
  • 今日はミーティングとかいろいろあって大変だったからかもしれない、そうと思いたい。

夏休み 25日目

今日は 12 時半起床。

  • 3時くらいに外出。某が某某某某と聞いて少し草を生やして同情。異常性を自覚するのは難しいらしい。
    • 某が雑誌を読んでいたので少し見せてもらう。低ランク行列分解を音声処理に応用するにはどうしたらよいかという話だった。近似尺度の設定方法にいろいろあるのだが、Kulback-Liebler ならびに Itakura-Saito の一般化になる β-divergence という概念があって、これを採用するらしい。肝心の最適化は懐かしき Majorization-Minimization を使うとのこと(あまり読んでいない)。
    • 結局のところ分解された行列の解釈がなんなのか、という話だと思うのだが、V≒WH (Wは縦長)としたときに W はそれぞれの時間に共通するトレンド、 H は時間に共通するトレンドを抽出しているっぽい?ここは重点的に読んだがあまりよく分からなかった。まあそのうち NMF で調べたりすると幸せになれるかもしれない。
  • ルオーは休業だし、カ某バ珈琲は予約が一杯だったので諦めてファイブコーヒー。まあうまかった。
  • 夜は新宿のロッテリア
  • 帰ってきてからは同期とボドゲ。楽しかった。
  • 12 時半になっていたのでそこから DB の問題をせっせと解く。眠みい。
  • あとは何をしたっけな……。
  • そうだ、ワクチン。祝日で情報は増えないが、控室でいろいろひっくり返していた。まず1回目が全人口の 2/3 をほぼ確実に超えていそう。すごい。このペースを保つことができれば、10月のちょうど真ん中くらいで 80% に達することができそうな計算になるのかな。まあ無理だろうけど。
    • それで他の国の数字をいじくり回していたのだが、ポルトガルが突出して異常。全年代で 90% 超えてるし、なんか 60 代以上は 100% 超えてるんだよな。何かがおかしい。
    • これでポルトガルの感染者数がほぼゼロになっていてくれれば割と安心できるところなので要注視ですかね。余裕があれば公式情報を片っ端から機械翻訳にかけるをしても良い。
    • 大阪府ファイザー供給が 10 月末で停止される(実質的に1回目は 10 月初旬で終わり)というのは少しびっくり。8割届ければそれでええんか。
    • 9割に届けるために残りの1割、一千万人ちょいの分が未達になるのは誰も幸せにならないのでちゃんとモデルナで埋めてほしいんだよな。ワクチン担当大臣氏〜〜。まあとりあえず、10 月に入ったらペースダウンはほぼ確約されたと思ってよさそう。9月でどれだけ伸ばせるかの勝負になってしまうのか……?
    • 経済再開の議論は総理が誰になるかで大きく変わってきそうなのでここには書かないでおこうかな。

夏休み 24日目

今日は7時半起床。墓参り。

  • 帰ってきてから夕食までの3時間ぐらい寝たので結局深夜2時半から 10 時くらいまで寝ていたのと等価。
  • 夕食後、まずは伊庭先生の YouTube 講義 MCMC 篇をついに消化。
    • サンプリングに2通りの意味(数理モデルとして与えられた分布からの実際の数値の抽出、社会調査として出てきた分析対象の数字を得ること)があるというのは確かにな、という感じ。喩えが面白い。
    • MCMCの要点:「サンプリングしたい分布に対してそれを「定常分布」とするマルコフ連鎖を構成、擬似乱数を使ってシミュレート」。これを見て割と分かったつもりになれるな。エルゴード定理と言われるとさらにわかり易い。
    • ギブズサンプラーはなんか聞いたことあるな。その別名の熱浴法は聞いたこと無い。まあちょっと考えてみれば、n次元からランダムに選んだ1次元だけの断面を見て確率に比例してランダムに取り直す(最大化すると計算量がしんどいというか一般に最大値が存在するとは限らなさそう)を繰り返しているので、まあそりゃ p.d.f. の最大値に収束しそうに見える。極大値に収束しないかは自信が無い。ガウス分布最高!
    • n次元の回転付き正規分布に対して MCMC を使わない方が良い(共分散行列の Cholesky 分解などを使うべき)のはそうなのか、という感じ。デモがあるの良いですね。値が収束しちゃダメなのはまあそう。分布が収束してほしいのはそれはそう。
    • (理不尽に厳しい)不等号制約を入れても同様にいけるのは確かに相当嬉しそう。truncated normal distribution から変数を出してくる方が難しそうではあるが。本来は高次元で有用なのはまあそれはそうっぽい。やっぱり問題としてはそれぞれのハイパーパラメータに対する条件付き分布に従う変数を上手く生成することに帰着されているのがミソっぽい。ここまでがギブズサンプラーの話。
    • イジング模型は未知。モンテカルロ法との繋がりだとメトロポリス法の方が主流っぽいので追うのは後回し。
    • 初期状態から与えられた分布に収束するまでに時間がかかるというのはまあそうやろな、という感じ。人力でやるほうがいいのかもね。任意の分布から生成したサンプルについて MCMC をしたときに収束先がちゃんと定常分布になっているためには、既約性(≒単連結性)が必要。証明にはカップリング法やペロン・フロベニウスの定理を使うらしい。そのうちやりたくなってきたな。
    • マルコフ連鎖は無記憶性を意味するものではない(確率1で直前と同じ位置にいるような過程もマルコフ連鎖なので)、まあ確かにという感じ。
    • 所望の分布を定常分布にするようなマルコフ連鎖は無限に存在するなかで、扱いやすいものとしてギブズサンプラーがあるわけだが、その設計原理として詳細釣り合い(detailed balance)というものがあるらしい。この詳細釣り合い無しのものとして諏訪によるものがあるが、それは脇道。詳細釣り合いを満たすような別の手法としてメトロポリス法があるらしい。たまに戻るような最適化、焼きなましを連想させるな。単鋒性のときはうまくいくらしい。まあそりゃそう。連続確率変数のやつは結構難しいらしい。そんなに使えそうな気はしないので深入りしない。
    • まあ面白かった。面白いかもしれん、と思わせるためのイントロとして良さそう?詳しくは本とか読んだ方が良いと思うけど。
  • 某がゼミをやるらしいので聴講だけでもしようかな、ということで PRML の2章を流し読みした。
    • 1章は某某で経験済。十分統計量の定義は、「その統計量の値が与えられた条件下で、問題のデータの従う条件付き確率分布がパラメータ集合と独立であるような統計量。」であった。復習。
    • 数式を追うのは初等的な線形代数と Fubuni で行けるやろ、とたかをくくっているが実はそんなことは無いのかもしれない。今回は流し読みに留めるが。まあでもガウス分布の条件付き分布もまたガウスとかはカルマンフィルタでも見るし……。
    • 共分散行列の逆行列を精度行列と呼ぶのは初めて聞いた。ガウス分布の条件付き分布が精度行列のブロック成分でわりあい簡潔に書ける(一方、周辺分布は共分散行列のブロック成分で書ける)という話。
    • 最尤推定アルゴリズム、Robbins-Monro アルゴリズムは未知だった。というかこれを最尤推定に使えるということ自体あまり自明じゃないやろ(式 (2.134))。
    • 共役事前分布とは、事前分布と事後分布が同じ関数形になるようなもの*1。事後分布の計算を簡単にするご利益がある。復習。一般に指数型分布族においては共役事前分布は有効な仮想データと解釈できるらしい。
    • 混合ガウス分布は定義+αで終わり。EMアルゴリズムは9章。つまり下巻らしい。下巻の目次: https://www.maruzen-publishing.co.jp/item/?book_no=294551
    • ベータ分布や多項分布が指数型分布族になっているのを示そうとすると自然にロジスティックシグモイドとかソフトマックスが出てくるのか。
    • 無情報事前分布のとこは読んでない。その後はノンパラメトリックな推定手法。ヒストグラム密度推定は次元の呪いを免れないうえに bin のサイズ選択が難しい。カーネル密度推定と最近傍法(includes K-means)。カーネル法は微小な立方体に分割してその中の数を数えれば確率の近似値が出る、というのが基本アイデアで、立方体だと不連続性が目立つので一般的にはガウスカーネルがよく使われる。これは空間全体における "目盛" が一定であり、濃度差に対応できない。対応できるのが K-means 。確率を知りたい点の近傍 K 個を含むような超球を考え、その中での密度を計算する。いずれも適切なハイパーパラメータ(カーネル法では立方体の辺の長さ、K-means では K)の選択が問題になる。
    • 計算はほぼ全部高速でかっ飛ばしたが、本質を捉えられていないという気はあまりしないので、明日も余力があったらこれでいく。演習問題は手を動かしたい気分のときにでも。
  • 最後に有本先生のやつをやろうとしたが、地獄みたいな行列計算パートが控えていたのでその直前でやめる。
    • 基本的にガウス分布のありがたみを感じようね、みたいなパート。多変量ガウス分布を marginalize したものもまた多変量ガウス分布になることが特に断りなしに用いられていたので証明を調べたりした。直接的な計算はちょうど今日読んだ PRML で見つけることができる。あるいは抽象的なものとしては、多変量ガウス分布の再生性を活用して、明らかにランク落ちしているような線形変換を使うというものがある*2。こっちを使うと割りと自明に落ちる。
    • 1個だけ行列式の計算がちょっとひっかかったものがあった。まあガウス分布の正規化定数なので一般論から明らかなんですが、いまいち示せない。将来いつかやるかも。
  • 明日から DB のやつを1日最低2問(これは大問単位)をすることに決めた。じゃないと参考書終わらんしね。
  • どうなるやら。わくわく。

*1:関数形が well-defined でないのが若干アレだが、まあ指数分布か、x^α(1-x)^β みたいな形くらいしか問題にならないようなので許容かな?

*2:https://fabiandablander.com/statistics/Two-Properties.html

夏休み 23日目

そろそろ「これ本当に毎日書けてる?どっかで1日くらい抜かしてない?」という不安が生えてきました。

  • 今日は 12 時起床。昨夜は3時半過ぎに寝たはずなんだけどな。
  • 昼を食べて、異常に眠かったので 15 時から 17 時くらいまでまた寝た。
  • あとは何をしたっけな。なんか頭痛が痛くて何もできない感じだった。
  • 台風接近のせいかなとも思ったが、気圧は上がってるときなのでそういう感じではなさそう?
  • びゃんびゃん麺*1は明後日になった。
  • 24 日は忙しいんだけど、23 日にゼミがあって、22日に某勉強会らしい。は?あとなんかあった気がするね。なんだっけ。
  • 今日は有本先生のやつ。といってもあんまり進まず。清水量子論も眺めたけど、離散版ボルン解釈まで。めっちゃ遅いな。
  • 腕立ては結構続いているけど、手を肩の真下にして 12 回とかにしても良い気がしてきた。これからそうします。
  • スクワットは5秒を 10 回でやめにしている。足上げ腹筋はできる限り。まあ 15 回くらいが妥当かね。

*1:漢字で書きたかったが、マトモなフォントはまだ収録できていないっぽいので却下。Unicode にも 13.0 で入ったばかりらしい。