5ちゃんねる ★スマホ版★ ■掲示板に戻る■ 全部 1- 最新50  

■ このスレッドは過去ログ倉庫に格納されています

【R言語】統計解析フリーソフトR 第4章【GNU R】

1 :132人目の素数さん:2011/01/09(日) 17:31:49
R は統計計算とグラフィックスのための言語・環境です。
統計計算で重宝するデータ型や、複数要素を処理する演算や関数、
解析結果を表示するグラフィックなど、多彩な機能を提供します。

●関連サイト
The R Project
http://www.r-project.org/
RjpWiki
http://www.okada.jp.org/RWiki/
リンク集
http://www.okada.jp.org/RWiki/?%A5%EA%A5%F3%A5%AF%BD%B8

2 :132人目の素数さん:2011/01/09(日) 17:32:13
●過去スレ
= 統計解析フリーソフト R =
http://science4.2ch.net/test/read.cgi/math/1062650510/
http://mimizun.com/log/2ch/math/1062650510/
= 統計解析フリーソフト R 【第2章】 =
http://science6.2ch.net/test/read.cgi/math/1152449095/
http://mimizun.com/log/2ch/math/1152449095/
統計解析フリーソフト R 【第3章】
http://kamome.2ch.net/test/read.cgi/math/1224142396/
http://mimizun.com/log/2ch/math/1224142396/

3 :132人目の素数さん:2011/01/11(火) 10:05:04
schemeのambに相当することはできるのでしょうか

4 :132人目の素数さん:2011/01/11(火) 11:56:09
>>3
RはShemeのような継続がないので全く同じ動作は再現できないと思います。
しかしベクトルの外積を使えば複数のambを組み合わせるのと似た事ができます。

独習 Scheme 三週間 Chapter 14 非決定性 (Schemeのamb)
http://www.sampou.org/scheme/t-y-scheme/t-y-scheme-Z-H-16.html
R言語
http://ja.wikipedia.org/wiki/R%E8%A8%80%E8%AA%9E
ベクトルに関する Tips 大全
http://www.okada.jp.org/RWiki/?%A5%D9%A5%AF%A5%C8%A5%EBTips%C2%E7%C1%B4

5 :132人目の素数さん:2011/01/11(火) 12:29:53
IncanterはClojureベースでR似の統計計算とグラフィックス環境です。
Rを単体で利用している人にはパッケージ不足な代用品にすぎませんが、
JavaアプリにはJVM系言語で書かれたIncanterの方が組み込みやすいです。

Incanter
http://incanter.org/
Data Sorcery with Clojure
http://data-sorcery.org/
naoya_t@Incanter
http://sites.google.com/site/incanterja/

6 :132人目の素数さん:2011/01/12(水) 09:20:46
どうせjavaならKawaで書いてくれればいいのに


7 :132人目の素数さん:2011/01/12(水) 12:40:29
>>6
Incasterのトップページにこういう意味の文が載っています。
「Incanterは動的型付けの関数型言語であるClojureのパワーと、
データアクセスと処理と視覚化のためのJVM上の豊富なライブラリを利用します」
IncasterはSchemeでは成立しないでしょう。

Clojureをつくったわけ by Rich Hickey
http://www.geidai.ac.jp/~marui/clojure/rationale/
>なぜ私は新しいプログラミング言語を書いたのだろうか。
>次のような特徴を持つ言語が見つからなかったから、という理由からだ。
> * 並行処理のために設計された
> * 定評のあるプラットフォームと相性がよい
> * 関数型プログラミングのための
> * Lisp。

> 1.2 関数型プログラミングは良いものだ
>  * Clojureは動的型付けをする関数型言語
>   o すべてのデータ構造がイミュータブルで永続的、再帰をサポート
>   o ヘテロジニアス(異種混合)なコレクション、戻り型
>   o 動的な多態性(ポリモーフィズム)

8 :132人目の素数さん:2011/01/12(水) 12:44:30
×Incaster
○Incanter

9 :132人目の素数さん:2011/01/19(水) 23:45:18
統計解析フリーソフト R 【第3章】
http://kamome.2ch.net/test/read.cgi/math/1224142396/527
> 527 :132人目の素数さん [↓] :2010/02/18(木) 17:43:21
> >>526
> ・スレッドのレス数が10以下
> ・レスが一週間書き込まれていない
> 二つの条件が満たされるとスレッドが沈むので
> そうならないようにしておけば沈まないよ

        ∧∧  ミ _ ドスッ
        (   ,,)┌─┴┴─┐
       /   つ.  保  守 │
     〜′ /´ └─┬┬─┘
      ∪ ∪      ││ _ε3
               ゛゛'゛'゛

10 :132人目の素数さん:2011/01/25(火) 22:44:23
sage

11 :132人目の素数さん:2011/01/26(水) 10:54:15
誰かRでbmpをimagematrixオブジェクトとして読み込む方法知らないか?

12 :132人目の素数さん:2011/01/26(水) 17:48:00
11だけど、EBImage使うことにした。
他にいい方法知ってる人いたらおせえて

13 :132人目の素数さん:2011/01/29(土) 03:04:25
read.matrixでひとつのファイルから複数の行列を読み込んだりすることは可能でしょうか?

初歩的な質問でしたらすいません、教えていただける方宜しくお願いします。

14 :132人目の素数さん:2011/02/06(日) 00:18:48
R初心者なのですが、小数の精度について解説されたサイト等ありませんでしょうか。

15 :132人目の素数さん:2011/02/06(日) 00:40:42
>>14
http://www.amazon.co.jp/dp/4901683500/
この本の14章あたりにあるよ
.Machine に浮動小数点演算関連定数のリストが収められてる


16 :132人目の素数さん:2011/02/13(日) 06:47:34
軸ラベルと凡例が日本語のグラフで、日本語のみに日本語フォントを使用してeps出力する方法をどなたかご存知ないでしょうか?
pdfなら、日本語関連を最後にまとめて、直前にpar(family=Japan1など)でいけるのですが・・・

17 :132人目の素数さん:2011/02/15(火) 22:46:52
質問です。

単回帰についてですが、データフレームの一列目に被説明変数が格納されており、
残りの列に説明変数が格納されています。

各説明変数を用いて単回帰を行いたいのですが、いちいち変数を指定するのが面倒です。
apply関数を利用しようと思ったのですがうまくいきません。

何か良い方法がありますでしょうか?


18 :14:2011/02/16(水) 21:17:20
>>15
規制で遅くなりました。ありがとうございます。

19 :132人目の素数さん:2011/02/18(金) 00:46:45
>>17
データフレームが縦横逆になっているということですか?
それなら関数t()を使えば通常のデーター形式になると思いますが。例えば
#irisデータを表示
iris
#縦と横が逆
t(iris)
#もう一度やると元に戻る
t(t(iris))

20 :132人目の素数さん:2011/02/18(金) 16:26:08
アウトライア分類と変数選択が同時にできる
線形回帰法ないのでしょうか

21 :132人目の素数さん:2011/02/22(火) 14:38:21.11
チルダ記号ってどういう意味なんでしょうか
関数(変数1 〜 変数2)
なんて使い方です

22 :132人目の素数さん:2011/02/25(金) 18:20:32.50
質問します。
glmを使い,説明変数の数を変えて複数のモデルを作りました。
複数モデルの中から最もあてはまりの良いものを知りたいので
AICを比較しようと考えたのですが,AICがInfとなり,表示してくれませんでした。
使っているソフトはRです。
AICが非常に小さいくて(おそらく2以下?)表示されないと考えているのですが,
これでは比較できません。
対処法をご存じの方がいらっしゃいましたら,教えていただきたく存じます。

23 :132人目の素数さん:2011/02/26(土) 08:00:23.96
最近MacにRcmdrをインストールしても文字が汚くならないというとのサイトを見つけたのですが、
ttp://ito-hi.blog.so-net.ne.jp/2011-02-06
「パッケージの依存関係を解決」にチェックしてインストールすると
虹色ぐるぐるでインストールされません

何が問題だと考えられますか?

環境は
iMac
Mac OS X 10.6.6
Intel Core 2 Duo
2.66 GHz

R 2.12.1

24 :132人目の素数さん:2011/02/28(月) 14:43:10.70
よく変数名に
foo.bar
と . でくぎられた名前があるのですが
Rにもc++みたいなclassがあるのでしょうか

25 :132人目の素数さん:2011/03/01(火) 17:49:13.03
>>20
lmをransacで繰り返し呼んだら?

26 :132人目の素数さん:2011/03/02(水) 03:00:19.18
>>23
>何が問題だと考えられますか?

自己解決力もないのにマイナーな環境で動かす冒険心。

27 :132人目の素数さん:2011/03/02(水) 03:29:20.55
>>26
確かにその冒険心は問題だわねw

28 :132人目の素数さん:2011/03/03(木) 17:19:55.02
cranに
RANSAC
ないのは、そのぐらい自分で作れってことなの?

lm繰り返し呼べばいいだけなんだけど

29 :132人目の素数さん:2011/03/06(日) 11:25:08.31
Mac の Carbon Emacs (23.2) で ESS 使い始めたんだけど、
R を呼び出すとメッセージが英語になる。
Terminal.app から R を呼んだ時は日本語表記なんだけど、
ESS 内でも日本語メッセージ使わせるためには何か設定が必要?

30 :132人目の素数さん:2011/03/06(日) 17:28:12.08
環境変数にLANG=Cでも設定してるんだろうか?

31 :29:2011/03/07(月) 10:57:20.97
~/.bash.rc では LANG=ja_JP.UTF-8 にしていて、
init.el では (set-language-environment 'Japanese) になってる。

ためしに、Terminal から明示的に LANG=ja_JP.UTF-8 emacs & で Emacs を
起動するとメッセージが日本語になった。
デフォルトで Emacs が LANG=C で起動されている??

32 :132人目の素数さん:2011/03/08(火) 19:58:24.45
Rそのものの話題ではないけど、
模試の大学合否判定って、A判定が80%以上、E判定が20%未満だな。
97.5%以上とか2.5%以下とかにしないのはなぜなんだろう。

33 :132人目の素数さん:2011/03/08(火) 20:05:19.44
高校生を絶望の谷へ突き落とすような事はしてはいけないのさ。

34 :132人目の素数さん:2011/03/08(火) 20:27:35.03
>>32
受験者数と合格者数を考えてみれば

35 :32:2011/03/08(火) 21:28:41.29
統計解析の本を見ていて、回帰分析と判別分析の違いかなと思えてきた。
p値が5%以下じゃないとモデルとして不適切などという手法ではないのでしょうね。

36 :132人目の素数さん:2011/03/11(金) 11:14:42.55
emacsからR使ってる人が多いんでしょうか?

37 :132人目の素数さん:2011/03/16(水) 18:58:17.39

筑波のCRANは停電というより地震による直接被害で、電気はきていますが、
漏水がひどい建物にあるので念のため落としています。 -- 岡田 2011-03-16 (水) 10:27:28

38 :132人目の素数さん:2011/03/17(木) 18:18:07.47
床がだいぶ乾いたので、筑波CRANミラー復旧させてみました。 -- 岡田 2011-03-17 (木) 13:17:57

39 :132人目の素数さん:2011/03/23(水) 14:38:52.94
Rのリストって
連想リストのことなの?

40 :132人目の素数さん:2011/03/24(木) 18:04:13.33
>>21
?formula

>>22
Infになるなら、そもそもモデルが不適切

>>24
?class

>>31
R環境の中からLANGを変更できるよ

>>36
誰も統計を取っていないが、昔はEmacs以外の選択肢が事実上なかった

>>39
全然違う

全レスって嫌われるのかなぁ


41 :132人目の素数さん:2011/03/24(木) 18:46:14.98
ステキです^^

42 :132人目の素数さん:2011/04/11(月) 08:54:06.06
Rでsuppot vector machineの分類の問題が解きたいので、
kernlab の中の SVM 関数 ksvmを使っているのですが、
例えばkernlab の中spamを分類すると、決定関数にsign関数で
符号化されて「spam」か「nonspam」の2値で結果が出力されます。
これを2値に符号化される前の決定関数で出力する方法はあるのでしょうか。
どなたかご存知の方はいらっしゃるでしょうか。

43 :132人目の素数さん:2011/04/12(火) 16:56:34.83
(祝) RStudio日本語対応!!

今の所特に日本語周りの不具合は無し
というわけで不要になったTinn-Rをアンインスト
NppToRは窓配置フリーが便利なのでとりあえず残しておく

44 :132人目の素数さん:2011/04/12(火) 17:16:53.99
>>43
Windows版ではそうかもしれないが、MacOSXとUbuntuでは
完全に対応していない。

45 :44:2011/04/13(水) 09:55:41.26
すまん。0.92.44から0.93.75に上げたら、
MacOSXで、問題があった日本語変数名も使えるようになった。
> Sys.getlocale()
[1] "C/en_US.UTF-8/C/C/C/C"
こんな感じだけど。

Ubuntu amd64の方も、エディタ部分で日本語が怪しかったけど、
これも直った感じ。



46 :132人目の素数さん:2011/04/13(水) 17:17:16.15
線形回帰で変数選択とロバスト推定の同時が出来る方法ないですか

47 :132人目の素数さん:2011/04/15(金) 20:26:39.00
Rって中身はCなんですか?
遅延評価Cで書くのすごい大変なのに
どうやってるんだろう

48 :132人目の素数さん:2011/04/19(火) 11:28:58.25
>>47
tar tf R-2.13.0.tar.gz | grep -oE '\.[a-z0-9]*$' | sort |uniq -c | sort -gr |head
599 .c
240 .h
194 .po
169 .mo
94 .in
87 .afm
52 .win
50 .save
45 .f
27 .gmo

RjpwikiのQ&A(初心者コース)に書き込んだmichiさんはこっちに来ないのかな。


49 :132人目の素数さん:2011/04/27(水) 15:52:48.74
ttp://cran.r-project.org/bin/linux/ubuntu/
Nattyまだこないね。

50 :132人目の素数さん:2011/04/27(水) 21:40:58.88
言語初心者ですので、教えていただきたいのですが
このソフトpropensity scoreを用いて解析をするときの参考になるサイトや書籍がありましたら教えてください。

51 :132人目の素数さん:2011/04/27(水) 23:20:30.27
>>50
おっ、同業者か。
nonrandomパッケージのVignettesを読まれてはいかが。
また、疫学のSIGのMLもあるので、参加されてはどうか。
ttps://stat.ethz.ch/mailman/listinfo/r-sig-epi

52 :132人目の素数さん:2011/04/28(木) 13:47:23.33
>>51
ありがとございます。
この休みにでもRのインストールからはじめてみます。
スレ違いかもしれませんが、propensity scoreを用いたマッチングでの解析を行うのに適したソフトは何でしょうか?

53 :132人目の素数さん:2011/04/28(木) 13:50:34.33
>>52
nonrandomパッケージのVignettesを読んでからもう一度質問してください。
ttp://cran.r-project.org/web/packages/nonrandom/vignettes/nonrandom.pdf

54 :132人目の素数さん:2011/04/28(木) 17:38:07.68
>>53
ありがとうございます。

55 :132人目の素数さん:2011/04/30(土) 09:11:31.24
nattyきたー
ttp://cran.r-project.org/bin/linux/ubuntu/

56 :132人目の素数さん:2011/04/30(土) 13:11:01.00
>>55
Releaseのファイルサイズが0でまだ使えないね
$ w3m -dump http://cran.r-project.org/bin/linux/ubuntu/natty/ |grep -oE '[a-zA-Z0-9_\.-]*amd64\.deb'
littler_0.1.3-1natty0_amd64.deb
python-rpy_1.0.3-17natty0_amd64.deb
python-rpy_1.0.3-18natty0_amd64.deb
r-base-core-dbg_2.13.0-1natty0_amd64.deb
r-base-core_2.13.0-1natty0_amd64.deb
r-cran-class_7.3-3-1natty0_amd64.deb
r-cran-cluster_1.13.3-1natty0_amd64.deb
r-cran-foreign_0.8.44-1natty0_amd64.deb
r-cran-kernsmooth_2.23-4-1natty0_amd64.deb
r-cran-lattice_0.19-26-1natty0_amd64.deb
r-cran-mass_7.3-11-1natty0_amd64.deb
r-cran-matrix_0.999375-50-1natty0_amd64.deb
r-cran-mgcv_1.7-6-1natty0_amd64.deb
r-cran-nlme_3.1.100-1natty0_amd64.deb
r-cran-nnet_7.3-1-1natty0_amd64.deb
r-cran-rodbc_1.3-2-1natty0_amd64.deb
r-cran-rpart_3.1.50-1natty0_amd64.deb
r-cran-spatial_7.3-2-1natty0_amd64.deb
r-cran-survival_2.36-8-1natty0_amd64.deb
r-mathlib_2.13.0-1natty0_amd64.deb
今あるパッケージはこれだけ。

57 :132人目の素数さん:2011/05/03(火) 20:04:04.55
ニューラルネットのパッケージnnetについて質問させてください。
すでにデータAを学習したネットワークにさらに別のデータBを学習させるにはどうすればいいのでしょうか?先にAとBを結合して読ませるのは時間がかかるために困っています。
他のパッケージなら出来るという情報もお待ちしています。

58 :132人目の素数さん:2011/05/05(木) 21:13:39.01
MySQLからダウンロードしたデータをRで計算して
MySQLに返しつつ、gnuplotで描画しようと思っています

RubyとかからMySQL、R、gnuplotを操作すべきか、
RからMySQLとgnuplotを操作すべきかで迷ってます

みなさんならどんな風にしますか?

59 :132人目の素数さん:2011/05/06(金) 13:30:23.98
>>58
このスレ的には、Rの中からMySQLにアクセスして、
Rで描画する方向が第一選択だよな。

Rのグラフィック能力とgnuplotってほぼ同等と思っていたけど、
Rを使っているのにgnuplotを加えて使うのは理由は?

>>57
反応がないから、Rjpwikiの方に書かれてはいかが。
私はnnetパッケージを使わないので分からない。

60 :57:2011/05/06(金) 22:06:00.16
>>59
そうしてみます。ありがとうございました。

61 :132人目の素数さん:2011/05/06(金) 23:00:08.59
gnuplotの方が慣れているというだけです。
Rで描けるようになればR+MySQLなのでシンプルでいいですね。

ちょっとやってみます。ありがとうございました。

62 :132人目の素数さん:2011/05/09(月) 23:39:55.72
pi<-seq(0,1,0.0001)
y_n<-60
n<-100

posterior<-((pi^y_n)*(1-pi)^(n-y_n))/beta(y_n+1,n-y_n+1)

の95%信頼区間を求めたいんですがその関数がよくわからないです誰かわかる人いらっしゃいますか?

63 :132人目の素数さん:2011/05/10(火) 09:08:37.12
>>62
Bayesian credible intervalは信頼区間じゃないよ


64 :132人目の素数さん:2011/05/10(火) 15:28:06.31
>>63 だね. bayequentistかな

65 :132人目の素数さん:2011/05/14(土) 21:58:27.95
for (i in 1:5) {sprintf("%s", ticker[i,1])}

だと上手く出力されないのはどうしてでしょう?
素人の質問ですみません

66 :132人目の素数さん:2011/05/14(土) 22:42:04.29
>>65
> sprintf("%s", ticker[,1])
> sprintf("%s", ticker[1:5,1])
> as.character(ticker[,1])
> as.character(ticker[1:5,1])

などと1行で書くのがR流じゃないかと。

ループ使った場合でも

> for (i in 1:5) {a[i]<-sprintf("%s", ticker[i,1])}
> a

とやれば配列aが表示される。

67 :132人目の素数さん:2011/05/15(日) 17:30:01.07
>>65
for文の中ではprint()が必要です。
for (i in 1:5) {print(sprintf("%s", ticker[i,1]))}

普通は>>66の言うとおり、
as.character(ticker[1:5,1])だけどね。

68 :132人目の素数さん:2011/05/25(水) 00:02:27.53
データ配列の最初から20個ずつをまとめ、
それぞれの20個のデータの平均値と標準偏差を求めるプログラムstatsample(m,data)を作成する。

プログラムソースが分かる人は教えてください。

69 :132人目の素数さん:2011/05/25(水) 09:29:38.65
>>68
とりあえず、たたき台を示すので、データ数が20で割り切れないをどうするのかを
考えて、その処理を入れて、その他のエラー処理を入れたら完成だと思う。

statsample <- function(x){
n <- length(x)
m <- floor(n/20)
for (i in 0:(m-1)){
print(paste("平均値:",mean(x[(1+i*20):((i+1)*20)]),"標準偏差",sd(x[(1+i*20):((i+1)*20)])))
}
}

> statsample(runif(100))
[1] "平均値: 0.409618140733801 標準偏差 0.284202820077949"
[1] "平均値: 0.449437574110925 標準偏差 0.286492195081962"
[1] "平均値: 0.555866089393385 標準偏差 0.26665116632303"
[1] "平均値: 0.28123870670097 標準偏差 0.226341301484355"
[1] "平均値: 0.503801094950177 標準偏差 0.282596081360767"


70 :132人目の素数さん:2011/05/25(水) 19:42:32.88
>>69
datamatrix<-matrix(data,20,length(data)/20)
apply(datamatrix,2,mean)
apply(datamatrix,2,sd)

とやるのが普通じゃないか。
データ数が20で割り切れない場合のwarningも表示されるし。

71 :132人目の素数さん:2011/05/25(水) 19:45:58.57
農家の果物の良品、不良品の検査や工場での製品の良品、不良品のチェックなどをシュミレーションにより実験する場合を考える。
このシュミレーションを行うために、不良品率x%でn個のサンプルの中に不良品を発生させるプログラムsampling(x,y)を以下の手順で作成する。
(1)不良品の出現確率x/100とする。発生させた一様乱数がx/100より小さければ、不良品(1)、そうでなければ、良品(0)とする。
(2)不良品出現確率x/100とした試行をn回繰り返し、不良品が出現した場合の数を求める。
 その数がsampling(x,n)の出力とする。
以下の手順をプログラムし、関数sampling(x,n)を作る。
誰か教えてください。

72 :132人目の素数さん:2011/05/25(水) 21:51:26.02
#include "/dev/console"

73 :132人目の素数さん:2011/05/26(木) 00:30:46.84


74 :132人目の素数さん:2011/05/26(木) 01:25:55.19
>>69

75 :132人目の素数さん:2011/05/26(木) 09:18:07.75
>>71
宿題?

ヒントだけ
> runif(10) < 5/100
[1] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE TRUE


76 :132人目の素数さん:2011/05/26(木) 22:53:09.94
rbinom(1,n,x/100)

77 :132人目の素数さん:2011/05/31(火) 02:28:47.96
sample関数について、中でどうやってドローしているんだろうと、
見ようとしたら、
.Internal( sample....
となってて、中身が見えません。
他の言語で作成しているのだろうと思いましたけど、
sample関数のソースって、どこにあるんでしょうか?


78 :77:2011/05/31(火) 02:32:14.67
自己解決しました。
CRANからソースを取得しました。


79 :あんでぃは非存在 ◆AdkZFxa49I :2011/06/06(月) 14:26:34.02
あんでぃ

80 :132人目の素数さん:2011/06/07(火) 04:41:09.16
乱数のところ、ソースみてもわからん。


81 :132人目の素数さん:2011/06/07(火) 22:07:44.63
乱数だからな

82 :132人目の素数さん:2011/06/07(火) 22:18:53.87
メルセンヌツイスターとかいうやつか

83 :132人目の素数さん:2011/06/17(金) 13:02:41.63
すいません、初心者です
株価の日次データが数年分あるんですが
グラフのX軸の目盛りを年次にしたい場合はどうすればいいでしょう?

84 :132人目の素数さん:2011/06/17(金) 13:23:39.86
>>83
a <- ts(1:2000,start=c(2011,6),frequency=365)
plot(a)

85 :132人目の素数さん:2011/06/17(金) 13:35:41.47
>>84
早速のレスありがとうございます
株など営業日がある場合どうすればよろしいでしょうか?
祝日や年末年始などありますし

86 :132人目の素数さん:2011/06/17(金) 13:52:29.96
>>85
xtsパッケージのドキュメントを眺めてから再質問してください。
ttp://cran.r-project.org/web/packages/xts/
日本語が必要なら、Rパッケージガイドブック pp.130-137

87 :132人目の素数さん:2011/06/17(金) 13:59:31.54
>>86
ありがとうございます。
パッケージガイドブックを買ってこようと思います。
これとR-tipsで頑張ります

88 :132人目の素数さん:2011/06/23(木) 16:49:30.62
RでVoigt関数(Gauss関数とLorentz関数のconvolution)でフィッティングするには、畳み込み積分を直接書くしかないのでしょうか。

89 :あんでぃはストーカー ◆AdkZFxa49I :2011/06/23(木) 21:21:17.46
あんでぃ

90 :132人目の素数さん:2011/06/24(金) 09:20:34.16
format="%Y/%m"
と書くと
2011/06
と出力されるけど、幅を節約して
11/06
とするにはどうすれば?

91 :132人目の素数さん:2011/06/24(金) 09:22:44.15
あ、ぐぐったら一瞬で判ってしまった
%y だ

92 :132人目の素数さん:2011/06/24(金) 10:43:36.69
>>90,91
そのあたりは共通だから覚えておいて損はないよ。

> format(Sys.Date(),"%Y")
[1] "2011"
> format(Sys.Date(),"%y")
[1] "11"
> format(Sys.Date(),"%EY")
[1] "平成23年"
> format(Sys.Date(),"%Ey")
[1] "23"



93 :132人目の素数さん:2011/06/24(金) 12:32:27.69
おおー
なんでEが平成なんだろう

94 :132人目の素数さん:2011/06/24(金) 13:01:48.18
>>93
マニュアルには、
%E Modifier: use alternative format
と書いてあるよ。つまり日本語ローケルだと、日本語化した形式にするという意味。

>>92を書き込んだ後、MacOSXとWindowsで試してみたが、
どちらも和暦にならなかった。GNUだけかも。ヘルプには環境依存って書いてあるしね。



95 :あんでぃはストーカー ◆AdkZFxa49I :2011/06/24(金) 16:34:26.88
分からない。

あんでぃ

96 :R入門:2011/06/26(日) 00:02:26.05
これまで、Java、Ruby、Scala など使っているものですが、
Rについても勉強したいと思っています。

Rのサイトをみると、結構、「使い方」的なサイトが多く、
汎用言語の視点から書かれた、サイト、本が少ない(?)ような気がします。

たとえば、ほかの言語と比較しながら書かれたような
本、サイトなどあれば、教えていただきたいのですが。
ありますでしょうか。




97 :132人目の素数さん:2011/06/26(日) 00:19:39.46
ぐぐりにくい、というのがRの最大の弱点

98 :132人目の素数さん:2011/06/26(日) 01:03:33.08
>>96
Rの基礎とプログラミング技法
http://www.amazon.co.jp/dp/4431712186
http://d.hatena.ne.jp/sesejun/20090331/p2

Rと他の言語を比較した本は知りませんが、
汎用言語としてのR言語を勉強するならこの本がお勧めです。

99 :132人目の素数さん:2011/06/27(月) 09:37:34.48
>>96
そういえば、Rユーザ会で、韓国から来た演者が汎用言語の視点から、Rの問題点などを
発表していたな。興味がなかったので内容は覚えていない。

汎用言語の視点で書かれた書籍はないと思う。
しいてあげるなら、>>98が薦めるリゲスさんの本しかない。

100 :85:2011/07/04(月) 10:41:00.37
Rパッケージガイドブックを購入
xtsをインストールしたんですが
データフレームをxtsにコンバートできません。
> x.xts<-as.xts(x)
以下にエラー as.POSIXlt.character(x, tz, ...) :
character string is not in a standard unambiguous format

Zooオブジェクトに経由させることもできません
> x.xts<-as.xts(read.zoo(x))
以下にエラー xts(coredata(x), order.by = order.by, frequency = frequency, :
order.by requires an appropriate time-based object

データフレームの中身は
日付 株価
20040101    1500
20040102 1450

といった具合に2列のデータなのですが?


101 :132人目の素数さん:2011/07/04(月) 11:05:02.37
>>100
ここに書くのではなくて、
それを書いた人に凸してみたら?

> library(xts)
要求されたパッケージ zoo をロード中です
> dat <- data.frame(日付=c(20040101,20040102),株価=c(1500,1450))
> dat
日付 株価
1 20040101 1500
2 20040102 1450
> as.xts(dat)
以下にエラー as.POSIXlt.character(x, tz, ...) :
character string is not in a standard unambiguous format
> rownames(dat) <- c("2004-01-01","2004-01-02")
> as.xts(dat)
日付 株価
2004-01-01 20040101 1500
2004-01-02 20040102 1450

まぁ、参考になれば。

102 :132人目の素数さん:2011/07/14(木) 14:34:30.11
Rで複素誤差関数 w(x) = exp(-x^2) erfc(-ix) を使いたいのだけれども、これはどうやって定義すればよいでしょうか。
相補誤差関数 erfc を qnorm 関数から定義すると、 qnorm が実数に対してしか定義されていないためエラーになってしまいます。

103 :132人目の素数さん:2011/07/15(金) 02:10:37.99
>>96
> 汎用言語の視点から書かれた、サイト、本が少ない(?)ような気がします。

Rの本を書いているのは、大学の先生が多いからね。
そして、大学の先生ってのはコンピュータのことや、
プログラミングのことをわかってないから。
Rの使い方だけの説明になってしまうのは
しかたがないと思いますよ。


104 :132人目の素数さん:2011/07/15(金) 11:23:45.87
× 大学の先生
○ 情報科学が専門ではなく疫学やら統計屋が仕事の教員


105 :132人目の素数さん:2011/07/16(土) 00:45:00.68
>>104
○ 大学の先生
X 情報科学が専門ではなく疫学やら統計屋が仕事の教員

特に情報科学の先生や院生などは、知ったかの馬鹿ばっかりです。

国立情報学研究所を見ればよくわかるでしょ?

税金を使ってPCで遊んでるだけ。

全員がコネ採用。


106 :132人目の素数さん:2011/07/16(土) 01:04:55.28
情報研究所て何やってるんだ?
唯のお飾りか?

107 :132人目の素数さん:2011/07/16(土) 16:16:24.06
国立情報学研究所は、仕事したくない院生や教授が
税金を無駄遣いしながら、馬鹿同士楽しく
PCで遊んでいる組織ですね。

どいつもこいつも馬鹿ばっかり。
コネがないと絶対に採用されません。
公募する前から採用者は決まってます。


108 :132人目の素数さん:2011/07/16(土) 16:49:55.56
なんか嫌なことでもあった?

109 :132人目の素数さん:2011/07/16(土) 20:02:28.47
国立情報学研究所

統計数理研究所

この二つは廃止で結構です。税金の無駄です。

110 :132人目の素数さん:2011/07/16(土) 20:09:53.71
疫学や感染症のシミュレーションをやっている連中なんざw
バカばっかりやなw あれで数学やっているつもりのもいるからw
頓珍漢なことばかりを言って来るw

111 :猫は嘘吐き ◆MuKUnGPXAY :2011/07/16(土) 20:20:25.68



112 :132人目の素数さん:2011/07/16(土) 20:58:33.45
というか、研究者というものは情熱と実力が必要だと思う。
しかし、単なる就職先のひとつとなっており、
学歴とコネのみで判断されるから。
実力で研究者になれるところって、少ないと思う。


113 :132人目の素数さん:2011/07/16(土) 21:06:58.59
そこの研究員全員の給料の上限を年収300万ぐらいにすれば他から文句はでないと思うよ。

114 :132人目の素数さん:2011/07/16(土) 21:19:33.03
職を失ったのか?

115 :猫は無職 ◆MuKUnGPXAY :2011/07/17(日) 03:35:47.40
職を失ったんは結構前やがな。




116 :132人目の素数さん:2011/07/17(日) 13:55:02.20
>>113
最近の調査では勤労者の平均年収が
370万円ぐらいらしいんですよ。
ただし最頻値は250万円ぐらいですから、
一部の高給取りが平均を上げていると思います。
また、公務員の平均は500万円ぐらいらしいですが、
公務員だけの平均年収は公表されていません。


研究と称してPCで遊んでいるだけですから、
年収150万円でも十分だと思います。


117 :猫の夢と痴漢の埋葬 ◆MuKUnGPXAY :2011/07/17(日) 14:08:35.01
>>116
『研究と称してPCで遊んでる人』だけをそういう待遇にしたら良いと
思います。但しソレをどうやって判定スルのかは現実には難しく、なの
で『虚偽院生と優秀院生の分離』と同様の困難が伴い兼ねませんね。

では質問ですが、虚偽院生に対してはどういう扱いが宜しいのでしょう
かね? やはり追放ですかね?




118 :132人目の素数さん:2011/07/17(日) 14:12:09.83
国立情報研究所も統計数理研究所も、仕事らしい仕事をしているのはほんの一部なのではないかな?
統計数理研究所では女の子の飲み物調査という論文もあったぞw

119 :132人目の素数さん:2011/07/17(日) 14:24:35.05
>>117
虚偽院生とは、論文を書かない院生のことですか?
全く論文を書く気のない院生は追放でしかたないと思います。

少なくとも論文を何本か書いていて、研究費も助成金も1円も
受け取っておらず、アルバイトをして授業料を納めている奴は、
他の人の研究の邪魔をしないかぎりは、追放でなくて放置でいいと思います。
つまり、まあおれのことですけどね。

追放すべきは高い給料、研究費や助成金をたんまりもらっているのに
結果を出さない馬鹿な奴です。
これは院生だけではなく、助手も助教、準教授、教授も含まれます。
それらは能力と業績だけで判定されるべきだと思います。
その業績というのをどう判定するのかが難しいわけですけどね。


120 :猫の夢と痴漢の埋葬 ◆MuKUnGPXAY :2011/07/17(日) 14:29:59.14
>>119
全くその通りだと思います。私が言う虚偽院生とは:
★★★『基礎体力も無ければ動機も無く、唯大学院に入学してしまったゾンビ』★★★
を指し示す言葉です。ですから恐らくは貴方の事ではないでしょう。放置
されていても自分から何かが出来る人は決してゾンビではアリマセンから。




121 :132人目の素数さん:2011/07/17(日) 14:41:00.64
>全くその通りだと思います。

つまり>>119の発言にまったく同意しているという解釈でよいですか?

122 :猫の夢と痴漢の埋葬 ◆MuKUnGPXAY :2011/07/17(日) 14:42:52.30
>>121
はい。『私は>>119氏の発言に全く同意』です。




123 :132人目の素数さん:2011/07/17(日) 14:51:47.93
やっぱCOLDPLAYいいよねぇ
眼醒めたらゾンビみたいだったが、観てたら生気がもどってきた
この辺のクオリティの高さは邦楽にはない、流石だとおもう。

124 :132人目の素数さん:2011/07/17(日) 23:18:34.72
コネっていうと響きは悪いけど、要するにコミュニティーを広げる努力をしてきたってことじゃない?
周囲と意見交換が出来るということは、非常に大きな能力であり財産だと思うよ

そして研究室への貢献度という点で言えば
論文は書かないけどPCで遊べる程度の実力はあって、周囲と意見交換が出来る奴 > 一人黙々と論文を書く奴
だと自分は思う

125 :132人目の素数さん:2011/07/17(日) 23:41:22.12
なら年収も130万でいいな
月10万でボーナス(一ヶ月)も出て国家的身分は安泰
やりがいなんかまったくないと思うかもしれないが、言うことなしの職場じゃないか

126 :132人目の素数さん:2011/07/17(日) 23:45:41.25
>>116
それこそ、そこのなんとか研究所に問い合わせをして詳細資料(統計データ)請求すればいいんじゃないの?
ただ気になったんだけど、rlang使ってるなら「加重平均」ってなんのことかはしってるよね。

127 :132人目の素数さん:2011/07/18(月) 02:46:14.96
↑馬鹿だ(笑


128 :猫は爺惨状の蚊軍 ◆MuKUnGPXAY :2011/07/18(月) 03:33:15.34
>>124
その考え方は決して認められない。大学は馬鹿がママゴトして遊ぶ場所
では断じてない。当然に:
★★★『黙々と論文を書く奴>論文は書かない奴』★★★
であり、PCで遊ぶかどうかや、周囲と意見交換が出来るかどうかなんて、
そんな事はどうでもヨロシ。

論文を書くかどうかだけが問題である。勘違いも甚だしい。ケシカラン。




129 :132人目の素数さん:2011/07/18(月) 03:34:40.12
>>128
まずお前が実績を出してから批判しような

130 :132人目の素数さん:2011/07/18(月) 04:44:10.88
>>126
「左右非対称分布の平均値は分布を的確に示せない」
のは統計の基本常識です。

集計方法と指標の定義: さまざまな平均値/中央値/最頻値
http://web-tan.forum.impressrd.jp/e/2008/07/11/3428

131 :132人目の素数さん:2011/07/18(月) 05:55:50.19
R使うくらいならmatlab使った方がいいと思う

132 :132人目の素数さん:2011/07/18(月) 06:00:29.17
それはない

133 :132人目の素数さん:2011/07/18(月) 07:56:35.43
猫さんが正論をいっとる

134 :132人目の素数さん:2011/07/18(月) 07:59:15.18
統計なんてやっている奴はバカw

135 :132人目の素数さん:2011/07/18(月) 10:43:44.13
統計は低脳のやる学問もどきである
どこの大学でも統計の先生の論文は下らんものばかり

136 :132人目の素数さん:2011/07/18(月) 10:54:16.08
量産可能で下らなくない論文とは例えばどういうのですか?

137 :132人目の素数さん:2011/07/18(月) 11:20:01.81
統計ですと、同じ様な調査結果を論文として何度も書く事が出来ます。

138 :132人目の素数さん:2011/07/18(月) 11:22:33.75
女子大生の飲み物調査

女子高校生の飲み物調査

女子中学生の飲み物調査

女子小学生の飲み物調査

女子幼稚園生の飲み物調査

20代OLの飲み物調査

30代のOLの飲み物調査

以下、女と男にかえても論文が書けます 統計数理研究所の教授がこうした論文を書いています

139 :132人目の素数さん:2011/07/18(月) 11:24:51.54
かけられた電話に出るまでの時間の統計的調査1 一部上場企業の場合
同上 2 2部上場企業の場合
同上 3 ヘラクレス上場企業の場合
同上 4 町役場の場合

以下 延々と書けます。

140 :132人目の素数さん:2011/07/18(月) 11:30:15.87
今渦中の経済産業省官僚のやることなんかはもっと姑息ですけどねw

141 :132人目の素数さん:2011/07/18(月) 15:21:16.30
グランドカノニカルは糞

142 :132人目の素数さん:2011/07/18(月) 18:25:28.32
等高線の書き方について質問です。
等高線を書きたいのですが、情報量が少ないため、contour関数では書けません。現在与えられているのは、20個の点に対しての座標(x,y,z)です。2次元上の布置まではできているのですが、等高線を用いてz座標を表現することができません。
どの関数を扱えばいいかなど、わかる方がいらっしゃいましたら教えてください。

143 :132人目の素数さん:2011/07/18(月) 18:59:47.11
手で書いたら? 天気図も昔はそうしたよ。

144 :132人目の素数さん:2011/07/18(月) 22:51:46.35
>>142
つか、授業聞いてなかったの?
全部説明したはずだけどね。
geoRで作成しなさいって言ったでしょ?
単位あげないよ!


145 :132人目の素数さん:2011/07/31(日) 19:04:21.64
データフレームの列名に日本語で文字化けして困ってます。


Rコマンダーでcsv経由。
RGUIはMSGhosicに設定。

コマンドでフォント指定以外に
対策あれば教えてください。

146 :132人目の素数さん:2011/08/01(月) 00:30:07.52
>>145
Rというよりそのcsvファイルがくせもの
解決策は2つ。
1. csvの文字コードを文字化けしないものに変更してからRに読み込む
2. Rの中でiconv()で文字コードを変換する
好きな方を選べ

147 :132人目の素数さん:2011/08/01(月) 05:59:12.09
>>146
了解です。

クリップボードを経由してみたら、ますます
酷くなりました。

特に列の変数名がボロボロです。
これはなにゆえでしょうか?

148 :132人目の素数さん:2011/08/01(月) 11:35:11.11
>>147みたいな学生を指導する教員は大変だな。

全く別のアプローチを提示してみます。

> dat <- read.csv(file.choose())
> dat
bake bakeda
1 32 re
2 242 ga

ここで列名が文字化けしていたとします。
本当に化けている状態を示せないので仮に"bake"とか"bakeda"とかにしています。

> names(dat) <- c("日本語","大丈夫")
> dat
日本語 大丈夫
1 32 re
2 242 ga

というようにnames()で、列名を自由に再設定できます。
列名が、文字化けしていて、なおかつ文字コードを変更する能力がないなら、
上記のような方法もあります。

149 :132人目の素数さん:2011/08/08(月) 14:36:57.39
[S]
東大,
弁護士,
Re,

150 :132人目の素数さん:2011/08/08(月) 14:38:15.29
[A]
TS10,SBR,VFK10,TKK,VF1,LCCR,SINX,
VF1M4,VF1L2,VF1H2,EMPC,MPE,
4231,4213,3331,3313,145,53A3,6236,
EMPCB,EMJ,LP,CJ,F4,LC,DNA,RNA,
SINT,JEL,23458,2348,DBT,GMO,
AB,APLWJKSJ,PES,WE,CA,RR,ASL,
EPH,ITU,261036,CBS6,1358,G1,AS3,M5,

151 :132人目の素数さん:2011/08/11(木) 22:25:16.52
質問です。

20個の変数があり、各変数は0 から 0.2 まで 0.05 ずつの値をとることが可能
また、この変数の総和は 1 となる。
この時の組み合わせをすべて求めたいのですが、
どうすれば良いでしょうか?

よろしくお願いいたします

152 :132人目の素数さん:2011/08/12(金) 01:53:48.61
>>151
> seq(from=0,to=0.2,by=0.05)
[1] 0.00 0.05 0.10 0.15 0.20
> factorial(5+20-1)/factorial(20)/factorial(5-1)
[1] 10626
この程度の組み合わせなら全て計算して合計が1のものを選んだ方が早いかも。

153 :152:2011/08/12(金) 02:20:56.85
とりあえず、20変数じゃなくて6変数の場合を提示するのであとは自分で考えて
> n <- seq(from=0,to=0.2,by=0.05)
> m <- expand.grid(n,n,n,n,n,n)
> m.s <- apply(m,1,sum)
> a <- m[m.s==1,]
> head(a)
Var1 Var2 Var3 Var4 Var5 Var6
3125 0.20 0.20 0.20 0.20 0.20 0.00
5625 0.20 0.20 0.20 0.20 0.15 0.05
6125 0.20 0.20 0.20 0.15 0.20 0.05
6225 0.20 0.20 0.15 0.20 0.20 0.05
6245 0.20 0.15 0.20 0.20 0.20 0.05
6249 0.15 0.20 0.20 0.20 0.20 0.05


154 :132人目の素数さん:2011/08/12(金) 03:46:54.73
変数の値を20倍すると、各変数は0〜4までの整数値を取れる、総和は20となる。
パターンは次の108通り。合計が20未満の場合は、足りない数だけ1を加える。変数が20個未満の場合は、足りない分だけ0を加える。
例:432→合計が9なので、1を11個加え、43211111111111、さらに数字の数が14個なので、0を6つ加え、「43211111111111000000」が真のパターン
44444 , 44443 , 444422 , 44442 , 4444 , 444332 , 44433 , 444322 , 44432 ,
4443 , 4442222 , 444222 , 44422 , 4442 , 444 , 443333 , 443332 , 44333 ,
4433222 , 443322 , 44332 , 4433 , 4432222 , 443222 , 44322 , 4432 , 443 ,
44222222 , 4422222 , 442222 , 44222 , 4422 , 442 , 44 , 433333 , 4333322 ,
433332 , 43333 , 4333222 , 433322 , 43332 , 4333 , 43322222 , 4332222 ,
433222 , 43322 , 4332 , 433 , 43222222 , 4322222 , 432222 , 43222 , 4322 ,
432 , 43 , 422222222 , 42222222 , 4222222 , 422222 , 42222 , 4222 ,
422 , 42 , 4 , 3333332 , 333333 , 3333322 , 333332 , 33333 , 33332222 ,
3333222 , 333322 , 33332 , 3333 , 33322222 , 3332222 , 333222 , 33322 ,
3332 , 333 , 332222222 , 33222222 , 3322222 , 332222 , 33222 , 3322 , 332 , 33 ,
322222222 , 32222222 , 3222222 , 322222 , 32222 , 3222 , 322 , 32 , 3 ,
2222222222 , 222222222 , 22222222 , 2222222 , 222222 , 22222 , 2222 , 222 , 22 , 2 ,1
各パターン毎に、変数の名前の入れ替えを考えると、合計35,561,166,195通りあると思われる。

155 :132人目の素数さん:2011/08/16(火) 17:26:31.50
Rのように多機能でクールでフリーの幾何学ソフト無いですか?

156 :132人目の素数さん:2011/08/16(火) 20:01:09.46
統計と幾何学ではだいぶソフトに求めるものが違うと思うけど、とりあえずこれなんかどう?
http://sites.google.com/site/geogebrajp/

157 :132人目の素数さん:2011/08/17(水) 15:07:10.21
以下のような複数の式に対して、どちらの式がより小さなzを与えるかの境界線をx-y平面上に引くためにはどうしたら良いでしょうか。
式は最大で4つほど、xとyに関しては整数を想定しています。

z=ax+by … (i)
z=cx+dy … (ii)

単純に総当りで(x,y)に対して、zを最小化する式を選ぶだけなら適当に関数を作ればいけそうですが(スマートではないですね…)、その境界をどうやったらグラフに引けるかがわかりません。

どなたか教えてくだされば幸いです。
よろしくお願いします。


158 :132人目の素数さん:2011/08/17(水) 18:16:26.16
>>157
>z=ax+by … (i)
>z=cx+dy … (ii)
この式でzが等しくなるax+by=cx+dyを引けばよいです。

>式は最大で4つほど
組み合わせが6組あるから6本引いてください。

>xとyに関しては整数を想定しています。
境界線を引くときは整数という条件を無視し、
グラフを見る時に整数が線のどちら側にあるか判断してください。

159 :132人目の素数さん:2011/09/01(木) 15:41:46.21
R

160 :132人目の素数さん:2011/09/05(月) 16:54:51.22


161 :132人目の素数さん:2011/09/05(月) 17:18:37.28
matlab使い慣れてる人向けの
R入門書ってないでしょうか

162 :132人目の素数さん:2011/09/05(月) 20:58:24.38
Ramsay, J.O., Hooker, Giles, Graves, Spencer (2010) Functional Data Analysis with R and MATLAB
(Use R) Springer-Verlag
Jan Graffelman (2010) Multivariate Analysis With Matlab And R CRC Press Online

163 :132人目の素数さん:2011/10/02(日) 01:52:40.21
基本的なことで申し訳ありません。
ワークスペースを保存しようとすると1kbのファイルしか保存されず、保存に失敗します。
原因がわかればよろしくお願いします。


164 :163:2011/10/02(日) 02:08:38.40
すいません。圧縮されているんですね。
スレ汚しすいません。

165 :132人目の素数さん:2011/10/04(火) 02:54:00.77
g <- function(x) x^2
plot(g)

こんな感じで半径1の円を描きたいのです。
教えてください。

166 :132人目の素数さん:2011/10/04(火) 09:53:36.95
>>165
symbols(0,0,circles=1,inches=FALSE)
お望みはこんな感じ?

167 :132人目の素数さん:2011/10/04(火) 11:45:17.26
>>166 ありがとうございます。

symbols(0,0,circles=1,inches=F, xlim=c(0,2), ylim=c(0,2))

図示されたイメージの縦横比(大きさ)を変えると
円の大きさも変化してしまうのですが…

できれば、sqrt(x^2+y^2)の式を用いて描きたいです

168 :152:2011/10/04(火) 12:39:57.11
>>167
>sqrt(x^2+y^2)の式を用いて描きたい
じゃあそうすればいいじゃん。なぜためらう?
> x <- seq(-1,1,length.out=100)
> y <- sqrt(1^2-x^2)
> plot(x,y,type="l")
これで半円だろ。
> plot(c(x,x),c(y,-y),type="l")
これで円になるだろ。


169 :132人目の素数さん:2011/10/04(火) 12:40:50.47
152ってなんだ、166の間違い

170 :132人目の素数さん:2011/10/04(火) 12:49:40.40
>>168 ありがとうございます。勉強になりました。

171 :132人目の素数さん:2011/10/04(火) 12:54:05.14
>>170
念のために、ちょっと改良
> plot(c(x,rev(x)),c(y,-y),type="l")

用途によるけど、円を描画したければ、symbolsを使った方が、
アスペクト比に影響されずに正円になるのでよいと思うが。
xy座標で円を描くと、asp=1にでもしない限り、普通は楕円になってしまう。

172 :132人目の素数さん:2011/10/12(水) 10:45:20.34
パッケージurcaのur.dfでlags=10, selectlags=c("AIC")
のようにAICやBICを使うと、
selectlagsをFixedしてラグを変えて一通り試しても
AICやBICを用いた計算に一致する結果がない、
自分で計算したBICとでは選択されたラグが一致しないなど
どこか間違っている気がします。
ソースを見ても
critRes <-AIC(result, k = switch(selectlags, AIC = 2, BIC = log(length(z.diff))))
lags <- which.min(critRes)
となっていて、当方の利用の仕方に間違いがあるのかどうかも分かりません。
どなたか、この点についてご教示いただければと思います。

173 :132人目の素数さん:2011/10/23(日) 19:16:11.40
確率の推定を行いたい
ロジスティック回帰のような、説明変数に対して単調増加する線形じゃなくて
多分ガウス曲線みたいな感じになると思うのだけれども
なんか適当なパッケージないですかね?

174 :132人目の素数さん:2011/10/24(月) 21:24:37.50
質問です。

都道府県 学年 テスト点数
京都 1 85
大阪 2 90
京都 3 70
奈良 2 60
東京 _3 90
・・・

というようなデータフレームDFが存在します。

これを各都道府県別に学年毎のテストの平均点を算出したいのですが、
どうすれば良いのでしょうか?

最初に都道府県別にデータフレームを分割すれば
tapply関数などで集約できるのですが、いかんせんfor loopで回すので
時間がかかります。ループを利用しないような簡単な計算方法はないでしょうか?

府県名 <- sort(unique(DF[,1]))
for ( i in 府県名 ){

}

175 :174:2011/10/24(月) 21:27:18.06
すいません。
途中で送信してしまいました。

現在は

府県名 <- sort(unique(DF[,1]))
for ( i in 府県名 ){
   temp <- sub(DF, DF$府県名==i)
 result <- tapply(temp, temp$テスト点数, mean)
}

のようにしてますがいかんせんループで時間がかかります。
よろしくお願いいたします。

176 :132人目の素数さん:2011/10/24(月) 22:11:15.94
R言語は知らないのですが、考え方だけ。
整数型配列を二つ用意します。大きさは両方とも6*47=282です。
名前はsum、counter。最初は全て0を入れておきます。
配列の1番目は、北海道の1年に対応させ、2番目は青森の1年...47番は沖縄の一年。
48番は北海道の2年...282番目は沖縄の6年。
あるいは、1番は北海道の1年、2番は北海道の2年、...、6番は北海道の6年、...
277番が沖縄の1年、...282番は沖縄の6年。
どちらでもかまいません。
一人目のデータを読み込み、京都1年に対応するデータのsumを点数の分だけ増やし、counterは1増やす。
これを全データで行います。一度スキャンするだけです。
この目的には、ソートは必要ありません。

177 :174:2011/10/24(月) 22:25:22.55
>>176
ありがとうございます。
Cならそれで十分なのですが、Rの場合ベクトルで扱うのでループ処理は遅くなるらしいのです。

もう一点質問です。

CODE CD VAL
0001 101 3
0001 201 4
0001 333 5
0002 201 2
0002 333 7
・・・

というデータフレームがある場合に
CODE VAL[101] VAL[102] ........ VAL[201] .............
0001 3 0 ........ 4 ...............

というようなデータフレームに変換するにはどうすればよいでしょうか。
これも現在はループを利用して処理をしております

よろしくお願いいたします。


178 :132人目の素数さん:2011/10/24(月) 22:51:31.71
データフレーム名をDFとして、中身が
pref grade score
kyoto 1
kyoto 1 85
oosaka 2 90
kyoto 3 70
nara 2 60
tokyo _3 90
・・・
として、
tapply(DF$score, list(grade=DF$grade, pref=DF$pref), mean, na.rm=TRUE)
みたいのではいかんのですか?
いや、私もよくわからんので、Rコマンダーにお伺いをたててみたんですがね。

179 :132人目の素数さん:2011/10/25(火) 02:06:48.72
>>178
ヘルプを見るとインデックスはlist of factorS とあるから、複数のベクトルをいれれるんだね。勉強になりました。

tapply(X, INDEX, FUN = NULL, ..., simplify = TRUE)
Arguments

X
an atomic object, typically a vector.

INDEX
list of factors, each of same length as X. The elements are coerced to factors by as.factor.



180 :132人目の素数さん:2011/10/25(火) 02:12:24.16
>>177
http://cran.r-project.org/web/packages/HSAUR2/vignettes/Ch_analysing_longitudinal_dataI.pdf
の三ページのreshape()かな

181 :132人目の素数さん:2011/10/25(火) 02:20:33.81
>>177

>CODE CD VAL
>0001 101 3
>0001 201 4
>0001 333 5
>0002 201 2
>0002 333 7
>・・・

>というデータフレームがある場合に
>CODE VAL[101] VAL[102] ........ VAL[201] .............
>0001 3 0 ........ 4 ...............

reshape(data, idvar="CODE", v.name="VAL", time="CD")

でどうでしょう。

182 :132人目の素数さん:2011/10/25(火) 02:28:43.43
>>181

reshape(data, idvar="CODE", v.name="VAL", timevar="CD", direction="wide")

でした。

183 :132人目の素数さん:2011/10/25(火) 09:18:31.89
サポートベクターマシンにて入力変数が多く、
精度を上げるための特徴選択を行おうと思い、
そのためのパッケージとして、"penalizedSVM"が
あると知りました(元々BioInformatics用みたいですが)。

http://r.789695.n4.nabble.com/Stepwise-SVM-Variable-selection-td3178718.html
http://cran.r-project.org/web/packages/penalizedSVM/index.html

しかし日本語の解説やリファレンスが皆無で、
英語でも分かりやすい解説がなく、
パッケージの公式リファレンスでは自分にはイミフでした。
http://cran.r-project.org/web/packages/penalizedSVM/penalizedSVM.pdf

どなたか実際にお使いの方がいれば、具体的に
どのように使用するか教えていただけないでしょうか。

184 :17:2011/10/25(火) 22:44:03.74
皆様ありがとうございました。
2つとも無事うまく解決できました。
やっぱりよくヘルプを読む必要がありますね。
精進します。

185 :132人目の素数さん:2011/10/26(水) 00:50:54.90
>>174の例で、各都道府県別+学年毎に分けたグループそれぞれについて
1対1の全組み合わせのt.testを一気に行う方法があるでしょうか?
(loopで回す関数を自作したりしない出来合の方法で)


186 :132人目の素数さん:2011/10/26(水) 07:28:10.01
>>185
それは、R以前の問題として、不適切だと思うのですが。
あるいは駄目な例としてやるってことかな?
二元配置の分散分析か、何らかの多重比較ではだめなんでしょうか?

187 :132人目の素数さん:2011/10/31(月) 21:41:20.58
CODE_1 CODE_2 VAL1 VAL2 VAL3 VAL4
______________________
AAAAA 122 NA 2.5 3.8 NA
AAAAA 154 2.4 1 4 5
AAAAA 166 3.4 4.0 4 5
AAAAA 178 NA 33 NA NA


BBBBB 122 4 3.4 4.3 1
BBBBB 123 NA 2 4 4
BBBBB 154 2 5 5 6



というようなデータをもつデータフレーム
これをCODE_2毎に相関を算出したいと考えております。

現在は
allcode <- sort(unique(DF$CODE_2))
for ( c_code in 1:length(allcode)) {
TEMPDF <- subset(DF, DF$CODE_2==allcode[c_code])
cor(TEMPDF[, -1][, -1], use = "pairwise.complete.obs")
・・・
}
でおこなっているのですが、いかんせんCODE_2の数が多く、
ループ数が非常におおくなります。

解決策などありますでしょうか?
よろしくお願いします

188 :132人目の素数さん:2011/11/01(火) 08:20:00.30
>>187
code_2を因子化、tapply cor


189 :132人目の素数さん:2011/11/01(火) 10:39:24.41
by(DF[3:5], DF$CODE_2, cor)
でいいんじゃないの?

190 :132人目の素数さん:2011/11/01(火) 11:23:41.66
>>189
>>187じゃないけど、by()ってこんなに便利だったのか。
> V=c(NA,round(runif(10)*10,1))
> dat <- data.frame(C1=sample(LETTERS,50,replace=TRUE),
+ C2=sample(100:105,50,replace=TRUE),
+ V1=sample(V,50,replace=TRUE),
+ V2=sample(V,50,replace=TRUE),
+ V3=sample(V,50,replace=TRUE),
+ V4=sample(V,50,replace=TRUE))
> by(dat[,3:6],dat$C2,cor)
dat$C2: 100
V1 V2 V3 V4
V1 1 NA NA NA
V2 NA 1 NA NA
V3 NA NA 1 NA
V4 NA NA NA 1
------------------------------------------------------------
dat$C2: 101
V1 V2 V3 V4
V1 1 NA NA NA
V2 NA 1 NA NA
V3 NA NA 1.0000000 -0.4458286
V4 NA NA -0.4458286 1.0000000
------------------------------------------------------------
dat$C2: 102
V1 V2 V3 V4
V1 1.0000000 NA 0.1731169 NA
V2 NA 1 NA NA
V3 0.1731169 NA 1.0000000 NA
V4 NA NA NA 1
[以下略]

191 :132人目の素数さん:2011/11/01(火) 11:47:20.47
http://beebee2see.appspot.com/i/azuYwLSFBQw.jpg
すまんこれ教えてくれ


192 :132人目の素数さん:2011/11/01(火) 12:23:35.93
>>191
見れねーよ

193 :132人目の素数さん:2011/11/01(火) 12:26:19.61
diagを使わずにforで対角行列作れって言われた
九行九列で

194 :132人目の素数さん:2011/11/01(火) 13:07:16.47
>>193
宿題は自分でやれ。
無意味な課題であることには同情するが。

195 :132人目の素数さん:2011/11/01(火) 13:36:14.59
ヒントだけ
> x <- array(0, c(9, 9))
> x[1 + 0:(9 - 1) * (9 + 1)] <- c("九","行","九","列","の","対","角","行","列")
> x
[,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9]
[1,] "九" "0" "0" "0" "0" "0" "0" "0" "0"
[2,] "0" "行" "0" "0" "0" "0" "0" "0" "0"
[3,] "0" "0" "九" "0" "0" "0" "0" "0" "0"
[4,] "0" "0" "0" "列" "0" "0" "0" "0" "0"
[5,] "0" "0" "0" "0" "の" "0" "0" "0" "0"
[6,] "0" "0" "0" "0" "0" "対" "0" "0" "0"
[7,] "0" "0" "0" "0" "0" "0" "角" "0" "0"
[8,] "0" "0" "0" "0" "0" "0" "0" "行" "0"
[9,] "0" "0" "0" "0" "0" "0" "0" "0" "列"
2行目をfor文に書き換えればOK

196 :132人目の素数さん:2011/11/01(火) 21:38:31.87
パズルとしてdiag、for以外の方法でやってみた

n=9;matrix(rep(rep(c(1,0),c(1,n)),n),n,n)

197 :132人目の素数さん:2011/11/01(火) 22:18:26.30
>>196
それは多分、定石に近いやり方だと思う。

APLでは同じロジックで以下のように書く。

n nρ1,(n←9)ρ0

198 :132人目の素数さん:2011/11/02(水) 01:29:13.55
一直線に並べた時のパターンを作っているのか
かしこいな

199 :132人目の素数さん:2011/11/02(水) 10:30:18.51
>>196
rep()の回数にベクトルを指定できるとは知らなかった。
昔からだったっけ?repのexample()を見たら、listのrepとかがある。
もはや何でも有りだなw

200 :132人目の素数さん:2011/11/02(水) 15:09:25.23
Rでも>197のAPL版みたいにできるんだなあ。warningはでるけど。
> n=3;matrix(c(1,rep(0,n)),n,n)
[,1] [,2] [,3]
[1,] 1 0 0
[2,] 0 1 0
[3,] 0 0 1
Warning message:
In matrix(c(1, rep(0, n)), n, n) :
データ長 [4] が行数 [3] を整数で割った、もしくは掛けた値ではありません

201 :132人目の素数さん:2011/11/02(水) 18:35:46.71
rep(0,n)じゃなくて rep(0,n-1)ではなくて?

202 :132人目の素数さん:2011/11/02(水) 20:41:59.14
>>200
そこでWarning出るところにRの設計思想があるのかも。

Rの源流に触れるつもりでAPLの教科書を読んだんだけど、
初っぱなのサンプルでこんな事やっているから

(( ̄1+ρc),27)ρc←'APL IS HAPPY '

APL IS HAPPY APL IS HAPPY A
PL IS HAPPY APL IS HAPPY AP
L IS HAPPY APL IS HAPPY APL
IS HAPPY APL IS HAPPY APL
IS HAPPY APL IS HAPPY APL I
S HAPPY APL IS HAPPY APL IS
HAPPY APL IS HAPPY APL IS
HAPPY APL IS HAPPY APL IS H
APPY APL IS HAPPY APL IS HA
PPY APL IS HAPPY APL IS HAP
PY APL IS HAPPY APL IS HAPP
Y APL IS HAPPY APL IS HAPPY

203 :132人目の素数さん:2011/11/02(水) 20:45:02.50
>>202
> (( ̄1+ρc),27)ρc←'APL IS HAPPY '

こっちが本来だった。

(12,1+2×ρc)ρc←'APL IS HAPPY '

204 :132人目の素数さん:2011/11/03(木) 02:20:32.86
Rでガンマ分布の最尤推定量求めたいんだけどどうすればいいんでしょうか



205 :187:2011/11/03(木) 09:38:31.29
>>188,189
遅くなって申し訳ありませんがありがとうございました。
byを使ってかなり高速化することができました。

ところでbyを使って取得すると

$AAAAA
VAL1 VAL2 VAL3 VAL4
VAL1 1.000 xxxx yyyy zzzzz
VAL2 ....

となりますがすべてのCODE2についてVAL1とVAL2~VAL4の相関のみを取り出すには
どうすればよいでしょうか?
byの返り値をresultとすると
for (i in 1:length(names(result))
result[[i]][ , 2:4]
}

とループを回すしかありませんか?
よろしくお願いします



206 :132人目の素数さん:2011/11/03(木) 10:38:07.92
>>205
どんだけforが好きなんだよw
forの方がむしろ思いつかんわ

207 :132人目の素数さん:2011/11/03(木) 16:14:38.08
ああいえば for you
forever are you

208 :132人目の素数さん:2011/11/04(金) 00:56:32.12
>>205

result[[1:n]][ , 2:4]

ってやったらどうなりますか?


209 :187:2011/11/04(金) 23:43:30.93
>>208
次元が違うと怒られます。。。。

210 :132人目の素数さん:2011/11/06(日) 16:00:11.33
基礎的な質問で申し訳ないのですが
膨大なデータから、-1と1を判別して予測する集団学習で
ランダムフォレスト、バギング、ブースティング、SVMの他に有用そうなものってありますか?

ググっても上の4つくらいしか出ないのですが十分ですかね。

211 :132人目の素数さん:2011/11/06(日) 22:20:02.20
エクセルやNumbersに比べてRって見た目しょぼすぎだなwww味気なさ過ぎ
もうちょっとグラフィックとかマシなのある?Mac使いとしはやっぱ見た目は重要。


212 :132人目の素数さん:2011/11/07(月) 00:01:59.45
>>211
Rはオブジェクト指向言語、BASIC、C、C++と比べて遥かに使いやすいし現実的な数値計算で使える。

#Excelと比較してC言語は地味でしょぼい
と嘆かれても困ったもんだ。RはExcelやNumbersとは用途が違う。

但し、重複する所もある。
具体的にはExcelのオプションの分析機能はRの機能と重なる。
使い分けが必要なんだな。

213 :132人目の素数さん:2011/11/07(月) 00:06:22.28
>>211
え?マジで言ってるとしたら勉強不足としか思えないのだが・・・
フォントを代えるなり、latticeやggplot2等のパッケージを試してみるといいよ
参照:ttp://rgm2.lab.nig.ac.jp/RGM2/

これは蛇足だが、学術ソフトの画像出力として「味気ない」というのは明らかに利点
大事なのは見易さと正確性であって、派手なグラフが良いとか考えていると周りから痛い子扱いされるよ

214 :213:2011/11/07(月) 00:08:09.72
あぁ、アプリ画面等がしょぼいって事でしたら、>>212さんの意見を参考にして下さい

215 :132人目の素数さん:2011/11/07(月) 00:25:08.30
俺のお薦めはR Commanderかな。これはRをGUIで使えるようにしたものなの

http://cwoweb2.bai.ne.jp/~jgb11101/files/R-commander.pdf

優れている点はR Commanderのメニューが
データ、統計量、グラフ、モデル、分布
に分かれているのだけれど、これって数学的な"分析"の手順に沿ったメニュー構成になっている事に気が付く。

ディープな分析をしたい時はRを使うし、事務的な作業をしたい場合はExcelを使う。
世の中の大半はExcelで十分だと思う。Rを使いこなせる人たちは高級な。

216 :132人目の素数さん:2011/11/07(月) 02:59:23.82
>>213
実にしょぼい

217 :132人目の素数さん:2011/11/07(月) 03:00:31.75
やっぱ派手さも大切だわ

218 :132人目の素数さん:2011/11/07(月) 07:58:28.74
分析する前が膨大な量のデータで、分析後も派手なグラフの結果では本質が掴めているとは言えないし読む人間も判断できない。
それでは分析する価値は無い。
例えば、ロジスティック回帰分析の場合、入力は膨大でもアウトプットはyesかno程度だよ。

まあ、派手なグラフィックパッケージを探したら?あるんじゃないの?

219 :132人目の素数さん:2011/11/07(月) 10:47:44.35
>>218
趣旨には賛同する。

> ロジスティック回帰分析の場合、入力は膨大でもアウトプットはyesかno程度
おーい。凡ミスか本気でそう思っているのかどっちだ?

220 :132人目の素数さん:2011/11/07(月) 12:18:25.23
>>218
なぜ結果がグラフィカルというだけで本質が掴めてるとは言えないの?
結果は変わらないだろうにww
あなた自身が本質を掴めてないのではww

221 :132人目の素数さん:2011/11/07(月) 14:01:31.17
>>220
横から参戦させてもらうが、そもそもデータ分析の目的は、
データに含まれる枝葉末節を取り除き、データの中に隠れている本質を洗い出すことにある。
苦労して洗い出した本質にまた余計なものを加えて汚すのはこれ如何に?

222 :132人目の素数さん:2011/11/07(月) 16:20:49.99
どなたかパッケージのtuneRに詳しい人いないですか?

223 :132人目の素数さん:2011/11/07(月) 18:42:59.29
>>222
リゲス先生が詳しいと思うよw

224 :218:2011/11/07(月) 23:07:11.83
>>219
"yesかno程度"の"程度"にいろんな意味がこめられているから大目に見てよ(^_^)。


225 :187:2011/11/07(月) 23:10:40.47
とりあえずunlistでベクトルに分解してから、
必要な要素だけを取り出すようにしました。
ループをまわさないのでだいぶ高速化されました。
ありがとうございまいた。

226 :218:2011/11/07(月) 23:13:34.77
>>220
>なぜ結果がグラフィカルというだけで本質が掴めてるとは言えないの?
誤解があったようですまない。
別に可視化(グラフィカル)の研究分野を否定しているわけではないよ。

人間の目で見て確認するのは結構有効なんだよね。
一例を探してみました。
次のURLの画像を見てもらいたいのだけれど

http://www-kairo.csce.kyushu-u.ac.jp/~norikazu/svm.png

左側の2次元平面上の青と赤の点を"シンプルな人工知能"で判別する事はできないんだ。
ところがSVM(サポートベクターマシン)と呼ばれる人工知能を用いるとこれを右側の3次元の問題に置き換える事で判別できるようにするんだ。

こういう判別ができているのか?出来ていないのか?は人間の目で判断して使い分けた方が良い場合がある。
だから可視化は一つの研究分野として重視されているんだ。

227 :218:2011/11/07(月) 23:20:49.19
但しグラフィカルには限度がある。
>>221 さんの主張にあるようにR使いの人たちは大体、数百次元のデータから4次元や5次元位に絞り込む。
でもグラフィカルの世界では基本的に3次元(z軸,y軸,z軸)が限界なんだよね。
4次元以上は色や形に置き換えて可視化する事になる。そうなると実は分かりにくいんだよ。

先のURLの人工知能の例でも所詮2次元から3次元へ問題を置き換えているに過ぎない。
分析の世界をまじめに可視化するとかなりハードルが高くなるんだよね。
勿論、高次元を可視化する手法としてSOMという方法も存在するよ。

228 :132人目の素数さん:2011/11/08(火) 09:30:33.83
面白い話が聞けた

229 :132人目の素数さん:2011/11/08(火) 09:45:20.37
>>218の豹変ぶりに笑った
データの可視化の話と、派手なグラフィックで装飾する話は別の話だと思うが。

230 :218:2011/11/08(火) 22:42:06.35
>>229
ああ、そうなのか。まじめに答えちまったい(^_^)。

でもn次元を2次元に強引にマッピングして可視化するSOMって人間が感覚的にデータの善し悪しを判断する時に結構使えると思うんだよね。
まあ、いいや。

231 :132人目の素数さん:2011/11/09(水) 09:17:28.99
結局さ、本質を取り出すことに意義を感じる研究者と、
データで相手を説得することに意義を感じるビジネスマンは、
相容れないと思うんだ。円グラフを立体化して一部を切り出したり、
棒グラフを無意味に立体化したり、グラデーションで彩色したりというのは、
ビジネスマンに必要かも知れないけど、研究者には必要がない。

232 :132人目の素数さん:2011/11/09(水) 22:27:50.28
質問があります。
MySQLからデータを取得し、データフレームに読み込ませたいのですが、
日付時刻のカラムがあり、どう読み込ませるのか分からず困っています。
-----
Updated [TAB] Rate
2011-11-08 15:03:00 [TAB] 77.645
2011-11-10 02:04:00 [TAB] 77.6255
2011-11-09 08:03:00 [TAB] 77.585
-----
単にread.tableでは読み込めませんでした。
Rは初めて使うので基礎的な事しかわかりませんが、どうかご教授ください。



233 :132人目の素数さん:2011/11/10(木) 15:56:58.04
>>232
直にMySQLならデータベースに直にSQLアクセスするパッケージを使う必要があるのでは?RODBCだっけ?

テキストに書き出して読み込むなら、read.tableがつかえると思けど時間が混じると読み込んでから変換が必要だと思う。

いずれも、Rデータ自由自在に書いてあると思う




234 :132人目の素数さん:2011/11/15(火) 11:15:58.60
1.i行j列成分がi^2+j^3で与えられる10行10列の行列をfor文を用いて作りなさい。
2.a=1000:1を作成してこれを昇順に並び替えなさい。
3.A=matrix(400:1,20,20)を作成し、この行列を第1列の値が昇順に並ぶように行を並び替えなさい

235 :132人目の素数さん:2011/11/15(火) 11:16:21.60
↑の回答わかる方お願いします。

236 :132人目の素数さん:2011/11/15(火) 14:26:46.90
>>234
また宿題か。
まさか試験中に書き込んでる?

237 :132人目の素数さん:2011/11/15(火) 22:14:50.47
>>234
> 1.i行j列成分がi^2+j^3で与えられる10行10列の行列をfor文を用いて作りなさい。

しかし、Rでfor文ってその教授はバカじゃないの?

常識的に
outer((1:10)^2,(1:10)^3,'+')
ってやるものじゃないのか?

238 :132人目の素数さん:2011/11/16(水) 00:17:57.03
>>234
1. a <- matrix(0, 10, 10); for (i in 1:10) {for (j in 1:10) {a[i, j]=i^2+j^3}}
2. rev(a)
3. A[20:1,]


239 :132人目の素数さん:2011/11/17(木) 09:59:23.86
R初心者として質問です。

Rを外部プロセスから呼び出したり、
シェルからRプログラムを渡して標準出力で受け取ったりはできるのでしょうか。

なにとぞよろしくお願いします。

240 :132人目の素数さん:2011/11/17(木) 12:17:43.67
>>239
$ echo 'print(pi)' |r
[1] 3.141593
とか
$ Rscript -e 'print(pi)'
[1] 3.141593


241 :240:2011/11/17(木) 12:20:00.76
>>239
> 標準出力で受け取ったり
無意味な例だけど、
$ echo 'print(pi)' |r | sed 's/3/A/g'
[1] A.14159A

242 :132人目の素数さん:2011/11/17(木) 18:28:14.48
>>240-241
ありがとうございました。
活用します。

243 :132人目の素数さん:2011/11/18(金) 10:01:50.10
>>239
シェルスクリプトから、短いRスクリプトを呼ぶなら、
ヒアドキュメントを使う方法が個人的に好き。

R --vanilla --slave <<_END_OF_R_ > output_of_R.txt
print(pi)
_END_OF_R_

別に、Rに限らず、PerlでもPythonでもこの方法は使えますが、、、

244 :132人目の素数さん:2011/11/18(金) 10:12:24.08
>>243
おぉ、Rって標準入力からそのまま普通に使えたのか


245 :132人目の素数さん:2011/11/18(金) 18:03:12.10
電波テロ装置の戦争(始)
エンジニアと参加願います公安はサリンオウム信者の子供を40歳まで社会から隔離している
オウム信者が地方で現在も潜伏している
それは新興宗教を配下としている公安の仕事だ
発案で盗聴器を開発したら霊魂が寄って呼ぶ来た
<電波憑依>
スピリチャル全否定なら江原三輪氏、高橋佳子大川隆法氏は、幻聴で強制入院矛盾する日本宗教と精神科
<コードレス盗聴>
2004既に国民20%被害250〜700台数中国工作員3〜7000万円2005ソウルコピー2010ソウルイン医者アカギ絡む<盗聴証拠>
今年5月に日本の警視庁防課は被害者SDカード15分を保持した有る国民に出せ!!<創価幹部>
キタオカ1962年東北生は二十代で2人の女性をレイプ殺害して入信した創価本尊はこれだけで潰せる<<<韓国工作員鸛<<<創価公明党 <テロ装置>>東芝部品)>>ヤクザ<宗教<同和<<公安<<魂複<<官憲>日本終Googl検索

246 :132人目の素数さん:2011/11/18(金) 18:03:58.46
魂は幾何学


誰か(アメリカ)気づいた
ソウルコピー機器

247 :132人目の素数さん:2011/11/19(土) 03:14:20.46
persp関数により3次元グラフを描画しているのですが、borderの幅が小さいためか、グラフが真っ黒になってしまいます。
この幅を変更する方法はありますか?また、他の解決方法がありましたら、教えてください。

248 :132人目の素数さん:2011/11/19(土) 11:32:20.50
>>247
グラフを大きくした方がよさげだけど、
pdf(file="247.pdf",width=14,height=14)
persp(...)
dev.off()
ぐらいから、サイズを試行錯誤してみれば?
borderの幅が線幅のことなら、lwdなどで指定する。

249 :132人目の素数さん:2011/11/19(土) 19:55:55.59
>>248
コメントありがとうございます。
サイズや、線幅を変えて試行錯誤してみましたが、どうもborderの線と線の間隔が狭いのが原因のようです。
この線と線の間隔の設定はできないのでしょうか?よろしくお願いします。

250 :132人目の素数さん:2011/11/21(月) 08:56:04.33
>>249
むしろ、border=NAとか

251 :132人目の素数さん:2011/11/25(金) 21:55:00.40
>>215
統計数理研究所で、昨日からRの無料講習会が開かれているようですね。
日程:2011年11月24日(木)− 11月26日(土)
場所:統計数理研究所(東京都立川市)3階セミナー室 2 (D304)
データ解析環境Rの整備と利用
http://mid.ism.ac.jp/stats/msg01502.html

252 :132人目の素数さん:2011/11/26(土) 00:49:00.80
いや、講習会じゃないんだけど…

253 :132人目の素数さん:2011/12/05(月) 12:21:38.19
>>238
ありがとうございました

254 :132人目の素数さん:2011/12/05(月) 12:21:47.65
解答分かる方お願いします

<演習問題1>
i番目の要素がi^2+1で与えられ各要素に名前が付いている次のベクトルを作りなさい。
(注:a[2]=5等のように直接値を決めるのはやめること。)
A B C D E F G H I J K L M N O P Q R S T U V
2 5 10 17 26 37 50 65 82 101 122 145 170 197 226 257 290 325 362 401 442 485


<演習問題2>
matrix(1:100,10,10)を作り、行の順番を入れ替え、そして行と列に名前を付けることで
次の行列を作りなさい。
a b c d e f g h i j
A 10 20 30 40 50 60 70 80 90 100
B 9 19 29 39 49 59 69 79 89 99
C 8 18 28 38 48 58 68 78 88 98
D 7 17 27 37 47 57 67 77 87 97
E 6 16 26 36 46 56 66 76 86 96
F 5 15 25 35 45 55 65 75 85 95
G 4 14 24 34 44 54 64 74 84 94
H 3 13 23 33 43 53 63 73 83 93
I 2 12 22 32 42 52 62 72 82 92
J 1 11 21 31 41 51 61 71 81 91


<演習問題3>
第i,j要素がi^5+jで与えられる10行10列の行列をfor文を使って作りなさい。


<演習問題4>
A=matrix(1:100,10,10)を作り
第3列目の平均を計算しなさい。

255 :132人目の素数さん:2011/12/05(月) 13:03:09.46
教員がココを見ていたら、>>254には単位をやらないことを勧める。

>>254
解答は1つではなく、人によって全く異なる解答例になる。
「100字以内で答えよ」という問題の解答が1人1人異なるのと同じ。
誰かがここに解答を示すかも知れないが、
ここの解答を写したことは、自分で独自に改変しない限り、バレるよ。

256 :132人目の素数さん:2011/12/05(月) 13:51:41.75
興味ない授業だが、取らなきゃいけない科目とかなのかな?


257 :132人目の素数さん:2011/12/05(月) 23:50:31.46
>>254
ヒント
names関数、xxxnames関数
LETTERS[1:10]、letters[1:10]
(LETTERS、letters は、組み込みの定数ベクター)

258 :132人目の素数さん:2011/12/06(火) 06:25:24.35
>>254
統計学の講義⁇


259 :132人目の素数さん:2011/12/06(火) 21:50:20.66
質問させてください

データフレームDFがあって
DF[, 1] にはコードが、
2列目以降は価格が入っています
2列目から501列目まで各時点の値です
行数は2000個程度です

このデータフレームから2つ選んで価格を足し合わせたいのですが
簡潔な方法はありますでしょうか?

現状は

a <- combn(DF[, 1], 2)
temp_a <- merge(t(a[,1]), DF)
temp_b <- merge(t(a[,2]), DF)

res <- temp_a[, -1] + temp_b[, -1]

でやろうかと思っていますが
データ数がデータ数なのでもっと高速な方法がありましたらご教授ください

お願いいたします

260 :132人目の素数さん:2011/12/07(水) 16:15:54.22
>>259
rownames(DF) <- DF[,1]
colSums(DF[t(combn(DF[,1],2)),])
ということ?

261 :132人目の素数さん:2011/12/07(水) 21:14:27.18
すみません、こんな質問していいのか分からないのですが、
検索しても分からなかったので質問させてください

自分は参考書を本屋でめくった程度のものなのですが、
PHPとR言語は連携できるのでしょうか?
また、CやPythonなどプログラミング言語にて簡単なもので言えばユークリッドとかベイズとかアルゴリズム化で処理できますが、
R言語の場合処理速度などはどの程度のものなのでしょうか?
Cなどで統計ものを書くよりも、R言語の方がシンプルなような印象を受けたのですが、あまり連携しているのを見かけません
何かR言語にデメリットがあって連携しないのかなと思ったのですが

262 :132人目の素数さん:2011/12/07(水) 22:30:28.03
>>260
それだと、
colSums(DF[,2:501])*(2000-1)
と同じじゃね?

>>259
「2つ選んで価格を足し合わせ」る、っていうのが、イマイチ具体的に理解できない。もっと正確に書いてくれないだろうか
それに、なぜ全行について2つの全組み合わせが必要なの?

263 :259:2011/12/07(水) 23:20:26.01
>260,262
ありがとうございます

例がわかりにくかったようで申し訳ないです

ランダム変数randuを用いた例だと

DF <- data.frame(randu)
一列目がコードと仮定します
colnames(DF) <- c("CODE", "VAL1", "VAL2")

rownames(DF) <- DF[, 1]
combi <- combn(rownames(DF), 2)
DF1 <- DF[t(combi)[, 1], -1]
DF2 <- DF[t(combi)[, 2], -1]

DFZ <- data.frame(t(combi), DF1 + DF2)
colnames(DFZ)[1:2] <- c("CODE1", "CODE2")

欲しいのはDFZで今回はranduを用いたので列はコードを除けば2つで
行数は400C2の約8万ですが
実際のデータは元データは行数2000 列数500ほどなので
結構時間がかかります

これより高速化はむずかしいでしょうか?
よろしくお願いいたします。

264 :きど:2011/12/07(水) 23:22:43.57
Rのテンドログラムの保存の方法を知りたいのですが。USBなど。。。

265 :132人目の素数さん:2011/12/08(木) 01:04:05.71
>>263
詳細、ありがとうございました

確実に言えるのは、デカいデータなので、後に使う予定がないのならDF1/DF2は作るなっ
てことかな (object保持の負荷が大きい)。他にも不要なobjectはrm()しておく
tcombi <- t(combi) # これは 2000C2 でも瞬時
DFZ <- cbind(tcombi, DF[tcombi[, 1], -1] + DF[tcombi[, 2], -1])
とするだけでも、「少しは」速くなるはず

DFZも丸ごと全部作らないで、tcombiを適当に分割したのを使って部分的に作っては
その都度ファイルに追記書き出しして、最終的にファイルから読み込んで df 化する方が
速いかも(テストしてないけど)

もう既に試されたかもしれない、ありふれた考えなので申し訳ないが...

266 :132人目の素数さん:2011/12/08(木) 09:17:07.19
>>264
画像ファイルへの出力方法を調べてください。
検索キーワードは「R グラフィックディバイス」です。
postscript(), png()などさまざまなものがあります。
X11()などスクリーン上のディバイスをコピーするなら、
dev.copy2eps(file="hoge.eps")
で、作業ディレクトリにeps画像ファイルが保存されます。
USBメモリへ保存したいなら、パス付きでファイル名を書けばよいです。
USBのマウント先が/Volume/FUGAなら、
dev.copy2eps(file="/Volume/FUGA/hoge.eps")
とします。
あなたが自分の環境を秘密しているので、助言できるのはこのくらいです。
詳細は、グーグル先生にお尋ねください。

267 :259:2011/12/08(木) 23:19:36.17
>>265

全部でやると32bitなものでメモリの使用量が4GBを超えてしまいましたので
提示いただいた分割する方法でファイルに書き出して対応できました
ありがとうございました

268 :132人目の素数さん:2011/12/08(木) 23:34:00.09
>>267
32bitの壁が問題になるなら64bitつかった方がよいと思うのだけど。
自分はRのために3GB→6GBにメモリ増設した。

269 :132人目の素数さん:2011/12/09(金) 22:44:47.03
>> 267
よかったですね

参考のため、もし差し支えなければ、どれくらいの時間がかかったのか、
動作環境も含めて教えていただけないでしょうか?


83 KB
■ このスレッドは過去ログ倉庫に格納されています

★スマホ版★ 掲示板に戻る 全部 前100 次100 最新50


read.cgi ver 05.05 2022/08/31 Walang Kapalit ★
FOX ★