Ubuntu12.04LTSセットアップ

Ubuntu12.04LTSを導入したので、個人的に最初に行う設定をメモ。

今回のコンテンツ

  • 日本版リポジトリの登録
  • 日本語入力環境の設定(Mozc)
  • 時刻設定(デュアルブート可能に)
  • Rythmboxの文字化け対策
  • その他環境設定に便利なもの

日本語環境周辺の設定

Ubuntu Japanese Teamのリポジトリ設定

Ubuntu Japanese Teamによる追加パッケージを入手(日本語Remixでない場合)。

wget -q https://www.ubuntulinux.jp/ubuntu-ja-archive-keyring.gpg -O- | sudo apt-key add -

wget -q https://www.ubuntulinux.jp/ubuntu-jp-ppa-keyring.gpg -O- | sudo apt-key add -

sudo wget https://www.ubuntulinux.jp/sources.list.d/precise.list -O /etc/apt/sources.list.d/ubuntu-ja.list

sudo apt-get update
sudo apt-get install ubuntu-defaults-ja

「憩いの場」のリポジトリ設定

sudo add-apt-repository ppa:ikoinoba/ppa
sudo apt-get update
sudo apt-get upgrade

参考:Ubuntu 12.04 LTS を導入したらまずやることまとめ » Libre Free Gratis! | Libre Free Gratis!

日本語入力メソッド(Mozc)の設定

日本語入力環境としては、Google日本語入力のエンジンであるMozcが便利。

sudo apt-get install ibus-mozc

#Mozcをインストール後、以下のコマンドでibusを再起動。

killall ibus-daemon
ibus-daemon -d -x &

ibusの設定から、日本語変換ソフトとしてMozcを設定。

参考:Ubuntu 12.04にMozcと窓使いの憂鬱をインストールする - Symfoware

時刻合わせ

Windowsとのデュアルブートにしていると、Windowsを立ち上げた時に毎回時刻がずれてしまうため、以下で設定。

sudo gedit /etc/default/rcS

UTC=yes」となっている部分を、「UTC=no」と書き換える。

参考:Ubuntu と Windows のデュアルブートでの時刻設定 何かやっとこ★/ウェブリブログ

Rhythmboxの文字化け対策

Rythmboxは標準設定では文字化けしてしまうため、少し設定をいじる。Rythmboxは終了して以下のコマンドを入力。

export GST_TAG_ENCODING=CP932

加えて、~/.xprofileに(ない場合でも作ればいい)、下記の中身を付け加えて保存。

export GST_TAG_ENCODING=CP932

すでにライブラリを読み込んでしまっていた場合は、もう一度ライブラリを追加し直す。

参考:gstreamerを使うアプリ(Rhythmboxなど)で曲名の文字化けを直す方法 - 玉虫色に染まれ!

その他環境設定に便利なもの

Unityのセッティングツール

sudo add-apt-repository ppa:diesch/testing
sudo apt-get update
sudo apt-get install unsettings

ConpizConfigマネージャー

sudo apt-get install compizconfig-settings-manager compiz-plugins-extra

参考:Ubuntu 12.04 LTS を導入したらまずやることまとめ » Libre Free Gratis! | Libre Free Gratis!

Rでロジスティック回帰分析

Rでロジスティック回帰分析をしたので、おおまかな流れをメモ。
無駄にオブジェクトや命令文が増えているが、自分にとっての分かりやすさを重視で。

分析

分析自体はデフォルトの関数(glm)を用いるが、追加でpsclパッケージを用いた。psclに含まれるpR2()で、対数尤度やMacFaddenの疑似R二乗値を計算してくれる。

他にもDesignパッケージのlrm関数というのもモデルの検定なんかに便利らしいので、今後また調べるつもり。

library(pscl)			#今回必要なパッケージ

#関数本体。dfはデータフレーム、yは0か1の従属変数、x1〜xnが独立変数。
ans <- glm(y ~ x1+x2+xn, family=binomial(link="logit"), df)

#切片のみモデル
ans0 <- glm(y ~ 1, family=binomial(link="logit"), df)

summary(ans)			#結果を表示
exp(ans$coef)			#オッズ比
pR2(ans)			#尤度比統計(詳細はヘルプファイル)
anova(ans0, ans, test="Chisq")	#尤度比検定(-2対数尤度でカイ二乗検定)

データを整えてファイル出力

ついでに結果をまとめるためのデータ操作も書いておく。

library(Hmisc)				#ここで使うパッケージ

##データの整形
(temp <- summary(ans)$coe)		#結果のスコアをデータフレームに
(usb <- temp[,1:2])			#偏回帰係数と標準誤差
(or <- data.frame(exp(ans$coef)))	#オッズ比
(table <- data.frame(usb, or))		#表の統合
(table <- round(table, 3))		#表を小数点以下3桁で揃える
(logL <- round(pR2(ans), 3))		#尤度比統計も桁を揃える
summary(ans)			#有意確率など、スコアの確認用に出力

ここまでやれば、あとはExcelなりLaTeXなりで使えるように出力して、表を整える。サンプルサイズや有意確率も忘れずに。

戸田山和久(2011)『「科学的思考」のレッスン』NHK出版

最近読んだ本。大事なことがコンパクトにまとまっていると思ったので、せっかくなのでメモ。

「科学的思考」のレッスン―学校で教えてくれないサイエンス (NHK出版新書)

「科学的思考」のレッスン―学校で教えてくれないサイエンス (NHK出版新書)

科学とはどのような思考・営みなのかという科学哲学のイントロダクションに加え、市民に求められる科学リテラシーについて言及されており、良い本だと思う。

内容

第1部では、科学でどのようなことが分かってきたか、という科学の内容と区別した、科学とはどのような活動なのかというメタ科学的な知識について整理されている。

科学的知識はあくまで理論であり事実ではないが、人間は真理とは何かを直接確認できないので、少しずつ理論や仮説をよりよいものにしていくというプロセスが重要になる(1章)。ではよりよい仮説とは何か(2章、3章)、そしてよりよい仮説はどのように構築・確認されるのか(4章、5章、6章)ということが述べられる。

具体的に良い仮説とは、1.より少ない情報でより多くの事柄を説明でき、2.新しい事柄を予言でき、3.アドホックで原因不明の事柄をなるべく排した仮説である。そうした説明のあり方は主に、1.別個の現象の因果関係を特定するか、2.一般的な法則から特殊な事例を説明するか、3.現象の性質を説明する、という3つの方法があり得る。いずれにせよ、「そうなっているからそうなっている」という「裸の事実」を減らしていくものであり、最終的には1つの体系による統合が目指されている。

良い仮説を作るためには、論理的に確実な命題を確認する演繹的推論と、新しい情報・可能性を付け加える非演繹的推論を組み合わせて、直接観察できない世界や法則に対して推論を行う。その推論を適切な検証にさらされ続けることで、仮説は改善されていく。その際、言葉をあいまいなまま用いたり、アドホックな仮説を積み重ねすぎると、反証可能性が担保されず、良い仮説にはならない。そして実験や比較という道具によって仮説を検証するが、コントロール、母集団、サンプリングが適切かを慎重に考えなければならないし、その結果見えた相関関係から、因果関係まで即断してはいけない。

第2部は、市民の科学リテラシーの必要性と、市民が科学にどのように関わるべきか、筆者の意見が述べられる。まず市民が科学リテラシーを身に付けるべき理由が挙げられる(7章)。そして、福島の原発問題をめぐってなされたコミュニケーションを題材に、市民に必要な科学リテラシーのあり方が述べられる(8章、終章)。

まず価値判断の問題(どうする「べき」なのか)には、経験科学が答えを出すことができない。しかし事実に関しても、科学が100%覆ることのない確実な真実を言い当てる営みではない以上、不確実な情報は残る。100%確実ではない情報に基づいて、リスク、コスト、ベネフィットの帰結を予想し、それらを天秤にかけて政策的な判断をするのは、科学ではなく政治の役割である。その意味で科学・技術それ自体も政策の論点になりえ、科学・技術のあり方に関する社会的意思決定に市民が参加する「科学のシビリアン・コントロール」が目指される。そのためにも、科学が原理的あるいは現状、どのようなことに答えを出せているのか、何を科学に問いかけるべきか、ということを判断する科学リテラシーが求められる。

感想

これまで、科学的な思考について体系的に学ぶ機会があまり多くなかったため、科学のフレームワークに関してコンパクトに整理されているのは大変勉強になった。院生として、「良い研究とはどのような研究か」ということを考える上でもいい本だと思う。なおかつ一般向けにもわかりやすい説明になっているのではないだろうか。

Rのアップデート(Windows)

新しくインストールしたパッケージがうまく動かなかったので、Rを2.14.1にアップデートした。
どうやらR自体のアップデートは、アンインストールしてから新しくインストールし直すしかないらしい。[参考]R for Windows FAQ

アンインストールしてもパッケージの情報は古いバージョンのフォルダに残してくれるので、古いバージョンのlibraryフォルダを新しいバージョンのlibraryフォルダに移せば終了。ついでに

update.packages(ask=FALSE)

でパッケージもアップデートしておく。

他の部分は再度設定が必要。とりあえず自分に必要なのはプロキシの設定と作業ディレクトリの指定。
スタートメニューからRのアイコンを選び右クリック、[プロパティ]でショートカットの設定を編集。
f:id:hnsn1202:20120216205542j:plain

[リンク先]の末尾に、半角スペースと「--internet2」という文字列を加える。この起動オプションはコンピュータのプロキシ設定を踏襲しろという命令。[参考]脳の中のこびと軍団 Rのプロキシ設定

[作業フォルダ]のパスにRの作業ディレクトリを設定しておくと、これでデフォルトの作業ディレクトリが設定できる。

上記の設定をしたショートカットをタスクバーなりデスクトップなりに追加してショートカットを置き換える。

これで基本的にはこれまで通り使えるかと。