おさかなメモ

間違っていることを書いているかもしれません.もし間違いを見つけましたらコメントで教えてください!

2024-02-01から1ヶ月間の記事一覧

selenium(-wire) の使い方

selenium-wireも基本的にはseleniumと同じだが,拡張されたものになっている. selenium.webdriverがブラウザを操作する「webdriver」.これはlocal上でも動かせるし,remoteでも動かせる.dockerで動かす場合はremoteで動かすことになる. 例えば,localでc…

条件付き確率と事後予測分布

条件付き確率は,真の確率を指す.事後予測分布は,パラメタライズされたモデルに関してパラメータを周辺化した分布.なので,真の分布ではなく,あくまで「予測」分布.

サンプル数とサンプルサイズ

そもそも「サンプル」という言葉の定義が,「一つの母集団からの $n$ 個の観測値」である. よって,「サンプル数」は,観測値が得られている母集団の数と等しい.「サンプルサイズ」は,1サンプルに含まれている観測値の数. 例 ランダムに選出された日本人…

学位審査発表会

提案手法の基盤となる定理・技術は,詳細には触れない(→数式をあまり出さない). なぜそれを使うのか,なにが嬉しいのかを伝える. その分,提案手法を伝えるのにスペースと時間を割く. 参考文献 2024年2月9日ゼミ後ミーティング

正規表現の基本

任意の文字に一致 . 場所を指定 行頭にのみマッチ:^<パターン> 行末にのみマッチ:<パターン>$ 繰り返し 0回以上の繰り返し:<パターン>* 1回以下の繰り返し:<パターン>? 1回以上:<パターン>+ いずれか(OR) 文字列のパターン<パターン1>|<パターン2> …

汎化性能と過剰適合(バイアスとバリアンスのトレードオフ)

パラメータ数が大きすぎると過剰適合する 訓練誤差と汎化誤差 訓練データに対する誤差を「訓練誤差」,実際の推定における誤差を「汎化誤差」という. 汎化誤差は期待値であり,厳密な値を取得できないので,標本平均などで代用する.この際に用いるサンプル…

十分統計量

確率変数 $X=(X_1,\dots,X_n)$ の統計量 $T(X_1,\dots,X_n)$ が,パラメータ $\theta$ に関して $X$ と同じ情報量を持つとき,統計量 $T(X_1,\dots,X_n)$ は十分統計量という. まず厳密な定義を述べて,なぜその定義が上記の意味を持つのかを説明する. 十…