きわめて個人的なR言語のメモ

2004-09-25Rで因子分析その2 一変量の分析

安打のヒストグラム

うぉっ

データマイニングリサーチNEWS

いきなりこのページが紹介されててビックリ。

いやー、仕事の現実逃避で書いてるだけのネタなので、まぁ参考になれば。

特にSASやSPSSを使える環境にない学生さんや俺みたいな貧乏サラリーマンのお役に立てればと思いますです。はい。

とりあえず、データを吟味してみる。

ヒストグラムを描く

hist(安打,col="chartreuse", border="black")

「安打」のところをそれぞれの変数の名前に置き換えれば、他の変数のヒストグラムを描ける。

col は塗りつぶしの色の設定、borderは境界線の色の設定。

colors()

とすると色の名前がいっぱい出てくるので、いろいろ試してみてください。

基本統計量

平均値、中央値、四分位点、最大値、最小値は、

summary(baseball)

で出力。以下のようなアウトプットが得られる。

     試合数           安打           二塁打          三塁打     
 Min.   : 95.0   Min.   : 93.0   Min.   :14.00   Min.   :0.000  
 1st Qu.:115.0   1st Qu.:123.5   1st Qu.:19.00   1st Qu.:0.000  
 Median :122.0   Median :139.0   Median :23.00   Median :1.000  
 Mean   :120.1   Mean   :136.9   Mean   :23.48   Mean   :1.533  
 3rd Qu.:128.0   3rd Qu.:149.3   3rd Qu.:27.00   3rd Qu.:2.000  
 Max.   :133.0   Max.   :180.0   Max.   :42.00   Max.   :8.000  
     本塁打           三振             四球            死球      
 Min.   : 0.00   Min.   : 38.00   Min.   :15.00   Min.   : 1.00  
 1st Qu.:10.75   1st Qu.: 64.00   1st Qu.:33.50   1st Qu.: 2.00  
 Median :20.50   Median : 77.00   Median :43.50   Median : 5.00  
 Mean   :21.28   Mean   : 79.47   Mean   :46.15   Mean   : 5.90  
 3rd Qu.:30.25   3rd Qu.: 90.50   3rd Qu.:59.00   3rd Qu.: 8.25  
 Max.   :44.00   Max.   :156.00   Max.   :86.00   Max.   :23.00  
      犠打             犠飛            盗塁      
 Min.   : 0.000   Min.   :0.000   Min.   : 0.00  
 1st Qu.: 0.000   1st Qu.:1.750   1st Qu.: 1.00  
 Median : 1.000   Median :3.000   Median : 4.00  
 Mean   : 3.733   Mean   :2.833   Mean   : 6.95  
 3rd Qu.: 5.000   3rd Qu.:4.000   3rd Qu.: 8.00  
 Max.   :27.000   Max.   :8.000   Max.   :55.00

標準偏差は

sd(baseball)

で出力。以下のようなアウトプットが得られる。

   試合数      安打    二塁打    三塁打    本塁打      三振      四球      死球 
 8.959167 20.065739  5.714957  1.641276 12.445259 23.979134 17.276245  4.897941 
     犠打      犠飛      盗塁 
 5.614348  1.757952 10.115310

トラックバック - http://r-user.g.hatena.ne.jp/bob3/20040925