理系学生日記

おまえはいつまで学生気分なのか

2023-01-01から1年間の記事一覧

極限操作と積分の順序交換(ルベーグの単調収束定理)

今日は、当たり前のようにやっている極限操作と積分の順序交換についてです。これはルベーグの単調収束定理と呼ばれるものですが、その証明を見ていきます。 測度空間$(X, \mathfrak{B}, \mu)$を考え、以下$E \in \mathfrak{B}$とします。 補題: 非負の単関…

GitLabにもSecret Detectionがある

世の中パスワードやアクセスキーといったSecretを公開リポジトリにPUSHしてしまうというような事故が起きます。GitHubにはSecret Scanningという機能があり、PUSHされた内容をスキャンしてSecretを検出できます。 もちろんGitLabにも同様の機能があり、Secre…

任意の関数は単関数で近似できる(単関数近似定理)

ルベーグ積分の定義は単関数に基礎があります。 空間$X$とその部分集合の$\sigma$-加法族$\mathfrak{B}$、$\mathfrak{B}$上の測度$u(A)$が与えられたとする。集合$E \in \mathfrak{B}$と$E$上の$\mathfrak{B}$-可測関数$f(x)$があるとき、$f(x)$が単関数$f(x…

具象構文木でdiffが取れるdifftastic

ソースファイルをdiffで比較する ファイルやディレクトリの差分を確認するコマンドは、diffです。 diffは一般に文字列で比較するため、プログラミング言語のソースファイルのdiffをとる場合は、何が変わったかわからないことが多くありました。 たとえば次に…

ルベーグ積分に至るまでの各種定義・積分の定義

ルベーグ積分を学ぶにあたって、まずは定義を押さえておかなければ話にならないので、本エントリで基本的なことをまとめておきます。 定義 $\sigma$-加法族 空間$X$の部分集合族$\mathfrak{B}$が次の条件を満たす時、$\mathfrak{B}$を$X$上の$\sigma$-加法族…

Unicodeの正規化、UCDに記載された分解結果について

Unicodeの正規化については以下で書きました。今日はその補足です。 なぜUnicodeの正規化が必要になるのか では「同じ」とはなんなのか 合成と分解 では具体的に見てみましょう 分解結果はどう定義されているのか 正規化実装ソース なぜUnicodeの正規化が必…

有限加法族とジョルダン測度

ルベーグ積分を定義するにあたっては色々な準備が必要で、まずはその初歩となる加法族、完全加法的といった定義を押さえていきます。 有限加法族 与えられた空間$X$の部分集合の族$\mathfrak{F}$が以下の条件を満たすとき、$\mathfrak{F}$を有限加法族と呼び…

印鑑レス口座の振替依頼手続きに印鑑が必要だった話

届出印を変更するより、印鑑レス口座にした方が便利そうじゃん 印鑑レス口座とは かんたん手続アプリで印鑑レス口座に切り替えてみる 口座振替依頼書を持って銀行へ行く 印鑑レス口座を用いた振替依頼には印鑑が必要だった 振り返り 先日、三菱UFJ銀行への口…

測度論:ルベーグ測度と可測集合

測度とは何か 測度が満たすべき条件 外測度の定義 測度が定義できる集合 可測である条件の言い換え $R$は可測集合か $A$が可測ならその補集合は可測か $\emptyset$は可測か $A,B$が可測なら$A \cup B$は可測か $(X \cap A) \cup (X \cap A ^{C} \cap B)$ $A,…

中心極限定理を証明するために:測度論との出会い

大数の弱法則の次は中心極限定理です。 中心極限定理は非常によく知られた定理ですが、高専・大学とこの辺りは「そういうものだ」して、しっかりした証明を学ぶことはなかったように記憶しています。今回せっかく統計を学ぶのならと中心極限定理の証明を理解…

RAGとFine-Tuning:LLMが持っていない独自の知識を使うには

ai

最近はどこもかしこもGenerative AIの情報で溢れるようになってきています。その中でもよく聞くのが、LLMが未学習である情報(例えば、企業等の組織内のデータ)を学習させ、それを元にした利用がしたいという話です。 LLMが未学習の知識を利用したい RAG (…

チェビシェフの不等式と大数の弱法則

チェビシェフの不等式 期待値$\mu$、分散$\sigma ^{2}$を持つ確率分布に従う確率変数$X$があるとします。 このとき任意の実数$k > 0$をとり、分散$\sigma ^{2}$の定義式から不等式を導いていくと、次のような不等式が導けます。これをチェビシェフの不等式と…

自由度$(m _{1}, m _{2})$であるF分布の確率密度関数を導出する

独立に$\chi ^{2} (m _{1}), \chi ^{2} (m _{2})$に従う2つの確率変数 $W _{1}, W _{2}$があるとき、それぞれをその自由度で割って比をとった $$ F = \frac{\frac{ W _{1}}{ m _{1}}}{ \frac{W _{2}}{ m _{2}}} $$ が従う分布を、自由度$(m _{1}, m _{2})$の…

VSCodeでNerd Fontsを表示させる

Nerd Fontsとは何か Nerd Fontsは、著名なプログラミング用フォントにグリフをまとめて追加したものです。 GitHub - FortAwesome/Font-Awesome: The iconic SVG, font, and CSS toolkitやGitHub - primer/octicons: A scalable set of icons handcrafted wit…

$t$分布の期待値と分散

今日は$t$分布の期待値と分散を求めます。 期待値 分散 積分項を求める 分散を求める 自由度が$m$である$t$分布の確率密度関数は次の式でした。 $$ f _{m} (t) = \frac{\Gamma \left( \frac{m+1}{2} \right)}{\sqrt{\pi m} \cdot \Gamma \left( \frac{m}{2} …

Starshipを使ってシェルプロンプトをカスタマイズする

重い腰を上げてWindowsマシンでCygwin環境を構築することにしたとき、やはり気になるのがシェル環境です。 As-is Starship プリセット プロンプト設定の何が嬉しいのか 設定 As-is 僕のメインPCであるMacでは、以下のようなプロンプトを使っていました。 Pow…

t分布の確率密度関数を導出する

統計学では、$t$分布と呼ばれる分布もよく現れます。 この$t$分布は、独立な2つの確率変数$Z \sim N(0,1)$、$W \sim \chi ^{2} (m)$の従うときに、次の$t$が従う分布とされます。 $$ t = \frac{Z}{\sqrt{\frac{W}{m}}} $$ この$t$分布の確率密度関数は次のよ…

2023年にCygwinについてまとめる

WSL2が使えない Windows PCでは諸事情でVPNを張っているんですが、これまた諸事情でVPNを張るとWindows上で動くVMからインターネットに出ることができません。 これで課題になるのがWSL2の利用です。WSL2ではVMの中でLinuxカーネルを動かす形態を取るので、…

カイ二乗分布の期待値と分散

自由度$n$のカイ二乗分布の期待値と分散を求めてみましょう。 前提として、自由度$n$のカイ二乗分布の確率密度関数は次の式で表せました。 $$ f _{n}(x) = \frac{1}{2 ^{\frac{n}{2}}\Gamma \left(\frac{n}{2}\right)} x ^{\frac{n}{2}-1} e ^{-\frac{x}{2}}…

標準正規分布に従う$n$個の確率変数の二乗和が、自由度$n$のカイ二乗分布に従うことの証明

今日はいよいよ、以下の命題の証明です。 なぜ標準正規分布に従う確率変数の二乗和が$\chi ^{2}$分布に従うのか。学生時代からモヤモヤしていた事柄が、長い年月を経てようやくわかります。 確率変数$Z _{1}, Z _{2}, \cdots, Z _{N}$が互いに独立に標準正規…

ベータ関数とガンマ関数の関係

統計学では$\chi ^2$分布に関して次のことが言えるとされています。 確率変数$Z _{1}, Z _{2}, \cdots, Z _{n}$が互いに独立に標準正規分布$N(0,1)$にしたがうとき、$W=\sum _{i=1} ^{n} Z _{i} ^{2}$の従う分布を自由度$n$の$\chi ^{2}$分布と呼び、$\chi ^…

ガンマ関数の性質

$Z \sim \chi ^2 (n)$を証明するために 統計学では$\chi ^2$分布という確率分布を学びます。この分布は、次のような文脈であらわれます。 確率変数$Z _{1}, Z _{2}, \cdots, Z _{n}$が互いに独立に標準正規分布$N(0,1)$にしたがうとき、$W=\sum _{i=1} ^{n} …

Cookieによる情報取得同意の要否と改正個人情報保護法

Cookieによる情報取得に関して同意を求めるポップアップが、多くのページで実装されるようになりました。 (GDPRではなく)改正個人情報保護法の観点で、Cookieの扱いに関して調べたことをまとめます。正しいのかは確信がないけれど。 私の中の結論としては…

2変量正規分布に関する条件付き分布の確率密度関数、期待値と分散

前回のエントリで導出した2変量正規分布に関する確率密度関数は次の式でした。 $$ f(X) = \frac{1}{2\pi \sqrt{\sigma _{x} ^{2} \sigma _{y} ^{2} (1 - \rho ^{2})}} \exp{\left( -\frac{1}{2(1 - \rho ^{2})} \left( \left( \frac{x - \mu _{x}}{\sigma _{…

2変量正規分布の確率密度関数を導出する

昨日のエントリにて、多変量の場合の確率密度関数の形を求めました。 $$ f(X) = \frac{1}{(2 \pi) ^{ \frac{n}{2}}\sqrt{|\Sigma|}} \exp{ \left( -\frac{ (X - \mathbf{\mu} ) ^T \Sigma ^{-1} (X - \mu)}{2} \right) } $$ ここで$X$は多変量であるような確…

多変量正規分布の確率密度関数の導出

標準正規分布に関する同時確率密度関数 標準正規分布からの一般化 $AA ^{T}$の意味 多変量正規分布の確率密度関数 標準正規分布に関する同時確率密度関数 まず、標準正規分布に従う、互いに独立な確率変数$Z_i \sim N(0, 1)$を考えます。 この時、これら$Z_i…

確率変数の共分散と相関係数

今日は、2つの離散的確率変数$X$と$Y$の和$X+Y$について考えます。 一部は独立な確率変数の和が従う確率分布と、正規分布の再生性 - 理系学生日記で行ったことですが改めて。 期待値 ここでは、2つの確率変数$X$と$Y$がとる値とその確率との対応を示す$P(X =…

指数分布の導出、その期待値と分散

ポアソン分布は、単位時間あたり平均$\lambda$回発生する事象について、ある時間中に発生する回数$X$が従う確率分布でした。 この「ある事象」が初めて発生するまでの待ち時間$W$が従う確率分布を「指数分布」と呼びます。今日は、この指数分布の確率密度関…

独立な確率変数の和が従う確率分布と、正規分布の再生性

$X \sim N(\mu_1, \sigma_1 ^2)$、$Y \sim N(\mu_2, \sigma_2 ^2)$なる、互いに独立な2つの確率変数$X,Y$があったときを考えます。その和$X+Y$はどのような確率分布に従うでしょうか。 結論としては$X+Y \sim N(\mu_1+\mu_2, \sigma_1 ^2 + \sigma_2 ^2)$と…

正規分布の標準化

確率変数$X$が正規分布$N(\mu,\sigma ^2)$に従うとき、$X$の一次関数$aX+b$は正規分布$N(a\mu + b, a ^2 \sigma ^2)$に従うと言う性質があります。 今日はまずこれを証明し、その上で$Z=\frac{X-\mu}{\sigma}$と言う変換が$N(0,1)$の標準正規分布に従うとい…