小梅の日記帳

覚書き、メモ、等々残していくつもりです。

2020-01-01から1年間の記事一覧

t分布について

2標本の差の検定について纏めておきたいと思います。 2つの標本とについて、 それぞれの標本の平均をとします。 分布の定義 分布の定義は以下の通りで、標準正規分布と分布の商で表されてます。 分布の自由度のところで証明した様に、平均値と偏差平方和は…

直交行列について

直交行列の定義について考えます。

標本平均を用いた場合のχ2分布の自由度について

標準正規分布に従う互いに独立な確率変数は、自由度の分布に従います。 また、正規分布に従う互いに独立な確率変数についても、自由度の分布に従います。 上記の様な母集団から抽出した標本については、自由度がの分布に従います。 自由度がになるのか不明だ…

標準化について

統計学では標準化とは、平均が0、分散が1のデータへ変換することを言う。 正規化とも呼ばれる。 この平均0、分散1へ変換出来ることを数学的に確かめたいと思う。 ある確率変数について、母平均をとすると、期待値は下記の様に表される。 これより、確率…

UbuntuでUbuntuのisoファイルを作成する

www.archlinux.site まず設置したUSBがどのような名称となっているのか確認します。 ここでは/dev/sda1というファイル名となっています。 sudo fdisk -l デバイス 起動 開始位置 最後から セクタ サイズ Id タイプ /dev/sda1 * 2048 15204351 15202304 7.3G …

DockerでMySQLの公式イメージを使ってみる

まずはMySQLのイメージをプルしてくる。 あとパスワードと接続先ポートを設定する。 docker pull mysql docker run --name mysql -e MYSQL_ROOT_PASSWORD=mysql -d -p 3306:3306 mysql hub.docker.com あとはdocker execコマンドでmysqlへ接続するだけ。 $ d…

FPがお多い方が良いのか、それともFNが多い方が良いのか?

多すぎるFPがいいのか?それとも多すぎるFNが良いのか?解決しようとしているドメインによります。医療統計の分野では、FNは実際は存在するはずが、病気が存在しないと医師や患者へ間違って安心させるメッセージを提供するでしょう。 このことは、時に、患者…

データの種別についての雑記

カテゴリカルデータ データを把握しないと可視化が上手く出来ない。 タイタニックのデータがどういったデータに属するのか整理しておく。 カテゴリカルデータとは 物事の性質を数え上げるデータのこと。 これを計数データという。 例えば性別、血液型(A,B,O…

vimuimとMouse Dictionaryをインストールしてみた

vimuim googleの拡張機能であるvimuimをインストールしてみた。 chrome.google.com vimの操作に慣れるとかなり便利だし、マウスを使わなくて済むので検索も早くなって良い。 ?で操作方法を確認できる。 Mouse Dictionary Kaggleのdiscussionを読むのに捗こと…

GitHubのSSHキーの設定の覚書

PUSHしようとした時にIDとパスワードを聞かれたので、今後も忘れてしまうかもしれないので覚書きを残しておきます。 sshキーの作成 $ cd ~/.ssh/ $ ssh-keygen -t rsa -C '[メールアドレス]' -f ~/.ssh/id_rsa_[ファイル名] # 例 # - 個人のGitHub $ ssh-key…