10/18 あさごはんが
えのきとぶなしめじ山盛り+油揚げの炊き込みごはんと,玉ねぎ人参ピーマンキャベツぶなしめじをこれでもかといれたコンソメスープ.お昼もおなじだけどはっぴー.いい匂いのめざめ.でもおなかいたい(あたったわけではない)
きょうはひとまず,セミナー復習もろもろ.
En-route/Pre-trip
En-route choice model(逐次選択):段階に達するごとにその先の効用を考えて選択
⇔pre-trip model:先に経路をすべて(最後まで)考えて,その効用を考えて選択
RLモデル
元論文:A link based network route choice model with unrestricted choice set
Transportation Research Part B: MethodologicalVolume 56, October 2013, Pages 70-80
説明資料:http://bin.t.u-tokyo.ac.jp/kaken/pdf/2014_oyama1.pdf
http://bin.t.u-tokyo.ac.jp/rzemi17/file/1-5.pdf
選択肢セットに制約を課さない,計量経済学的なランダム効用モデルの経路選択モデル.特徴は,無限の選択肢でMultinominal model(MNLモデル)と静的なモデルと等価であることを示せているということ.link size(リンクサイズ)を導入して,リンクが加算的だが重複するパスの効用を訂正する.
やっぱり3000ノード,7000リンクくらいなら回るはずらしい.
有向グラフをリンクとノードで定義する.決定段階はそれぞれのリンクと結びつけられている.
活用は
・道路ネットワーク関連,たとえばロードプライシング,インフラ投資などへのモデル
・ルートガイドソフトウェア.ダイクストラ法により最低コストを算出.
長さ,速さ,遅延しやすさ,右折数など様々な特徴を持っているパスに対して,パスのコストを算出する必要がある.経路選択モデルで観測された選択に対してパラメタ推定ができる.
Rust(1987)の動的離散選択モデルのように,MNLモデルの形で経路選択を記述することはできるのだけれど,そうすると選択肢が無限に生じることになってしまう.なのでこれまでの観測されたパスから推定されることのできる経路選択モデルというのは,みんなパスに基づいていて,つまり離散選択がパスに沿って行われるということを記述したものだった.
RLモデルなら,推定することも効率的な方法で予測のために使うこともできるという利点がある.経路選択モデルと有限MNLモデルに基づいた一連のリンク間のリンクを
与える.
サンドイッチ推定量
ここが平易でよさそう.
がムーア・ペンローズ逆行列が未達性質.一般化された逆行列の性質ということになる.
Aが縦長なら||Ax-b||^2, Aが横長なら||x||(ノルム)が最小.こうしておくと誤差が最小ということ.
Rではlibrary(MASS)を実行してginv()を使えば求められる.要するに「逆行列は存在しないのだけれど,もっともそれっぽいものを充てるなら」というような行列が出る.
準ニュートン法(BFGS)
まず,ニュートン法というのは最大値探索の方向の決定の方法(式は下のリンクから).解の近くでは二次収束するのでそれが利点だが,ヘッセ行列の計算に時間がかかる&収束しないことがある&ヘッセ行列が計算できないとだめ.
そこで使われるのが準ニュートン法.ヘッセ行列を逐次的に近似しているのでヘッセ行列の逆行列がいらないらしい.
===
以下http://bin.t.u-tokyo.ac.jp/model14/lecture/Sasaki.pdfから.
ヘッセ行列が逆行列をもたないとき
・変数が完全相関
・変数が効用関数に効かない
ここに書いてあったから変数が効かないっていう解釈はあってた.よかった.
あとはモデルが間違えてるとか,近似がいまいちとか,初期値が不適当とか,推定できないモデルだとか.
MCMC法
・MCの一個目:マルコフ連鎖(Markov Chain)
マルコフ連鎖とは,「それより前の状態に現在の状態が影響される」こと.
・MCの二個目: モンテカルロ法(Monte Carlo)
モンテカルロ法とは,乱数を発生させて頻度を用いてある値を求めるというもの(モンテカルロというのは昔のお金持ちの街で,乱数を発生させるのはコンピュータが発展するまではとても大変なことだったので,「お金持ちしかできないでしょう」という揶揄みたいなネーミングらしい).
初期値を与えてマルコフ連鎖(パラメータが収束するまで)→繰り返し繰り返しパラメータの分布を得るモンテカルロ法→その中央値や平均値を推定値とする
Rだとlibrary(MCMCpack)で使えるみたい.まだよく見てない.
どういうときに使うかというと,
・条件付き分布は分かるが,積分が難しいので周辺分布が求まらなくてパラメータが推定できない(階層モデル,混合効果モデル)
・サンプルの数が少ないので,最尤法だとパラメータの値が不安定(説明変数にカテゴリ変数や交互作用項が多い.ロジスティック分布など)
http://bin.t.u-tokyo.ac.jp/model16/lecture/Chikaraishi.pdf
これを満たすと,選択確率がGを使ってかける.要するにそのような形のモデルの一般化式ということ.
この誤差項がmultivariate extreme value (MEV) 分布に従うとすると計算ができて確率が超シンプルに表せる…みたいな流れ.Logit, Nested Logit, Paired combinational logit, Generalized nested logitなどさまざまなモデルに適用できる.
一般化G(A)関数(Mattsson et al., 2014)
こちらも満たすべき性質が四つあって,確率が表されるようになる.ある条件をさらに満たすと,具体的にはiidガンベル分布に従うとかeのVij乗で確率のなかのA関数の係数が表せるとかすると,上のMcFaddenのG関数に一致する.つまり,McFaddenのG関数をさらに一般化したのがこれということになる.こちらもこれを使って算出する確率は非常に美しい.
よくわからないけど,一般化するとふつうモデル推定が困難になるらしい.