読書会成果物:2018/07/15 PythonユーザのためのJupyter[実践]入門
 Share
The version of the browser you are using is no longer supported. Please upgrade to a supported browser.Dismiss

View only
 
ABCDEFGHIJKLMNOPQRSTUVWXYZ
1
章番号ページ番号質問内容回答者回答内容
2
タイトルPythonユーザのためのJupyter[実践]入門
3
答え ※必ずしも全て本に書いてある内容そのものだけでなく、読書会参加者の個人的な見解である場合も含みます
4
はじめに3Matplotで同じグラフを描画するために複数の方法が存在する…とは?
5
138グラフに日本語を出す方法について教えてください
6
249jupyterの基本操作でおすすめはどれになるでしょう?
7
267Markdownはどのようなときに使う?saru999コメントのように文字等を記述したいときに使う。
8
272マジックコマンドでは何ができますか?また、できることのうち特に嬉しい機能はどれで、実際のデータ分析の場面ではどのような使い方をすることが多いですか?
マジックコマンドの%editって使えるのでしょうか?
kawamoto%timeや%timeitなど処理実行を計測するものがある、また、%autosaveコマンドでAuto Saveの頻度を調整できる。
matplotlibに関する設定を行うことができる%matplotlibもあるので
%matplotlib inline あたりはよく使うのではないかと思われる。
9
278JupyterNotebookを共有するにはどのような方法がありますか?
10
398ファイル形式はcsv形式がいいのでしょうか?pickle形式のファイルはどんなときに有効ですか?mocamocalandcsv形式だと1分くらいかかるがpickelだと7秒で終わる。Python で処理するときは pandas の DataFrame 形式に変換することが多く、CSVからDataFrame に変換する処理は意外と時間がかかり、特に大きなデータセットでこれを毎回やっていると効率が悪くなる。 詳しくは
https://tech-blog.abeja.asia/entry/pandas-saving-memory-pickle
11
3116クロス集計について教えてくださいkonuma2 つの項目に注目して同時に集計すること。SQLでめんどくさいというのはエンジニアあるある。この本ではPandasのgroupby(), pivot_table()を利用して表示する方法を紹介している
12
3120pandasは時系列データの処理機能としてどんなものを持っているか教えてください。mocamocalandDatetimeIndex: datetime型に特化した処理ができる
index Seriesのインデックスとして使用する場合でも利用可能
時系列データ処理を抽出:インテグサに文字列を指定する場合や特定の年や月のみ抽出する場合で利用可能、年や月などを指定してスライスも行う
時系列データの頻度を変換するリサンプリングという手法があります
データの取得:時系列データで使用される関数が存在
13
4~7138matplotlib, bokehでそれぞれ状況によって使い分ける場面があればどういった時かsusumuismatplotlib:画像を出力する、bokeh:HTMLを出力(動く)
susumuis: matplotlibの方が情報も多いし安定しているのでは?
driller: そんなことはない。研究等で画像が必要な場合はmatplotlib、Web前提のものはbokehが良い
susumuis: 確かに、グラフを大量生成してフォルダに吐き出すプログラムをmatplotlibで作ったことがあります
14
4139matplotlibでかけるグラフにはどの種類の物があるかおしえてくださいmoe_honey2折れ線グラフ、散布図、棒グラフ、ヒストグラム、箱ひげ図、円グラフが使える。軸や目盛線、グラフタイトルなどを詳細に設定することも可能。
15
4-7,6-8185ひげ箱図はどういった場面で使用しますか?naisen4242つ以上のデータ間のばらつきを比較する
16
216線のスタイルの設定方法について教えてくださいsusumuisp.211から217に具体例とともに書かれている。color, linewidth, linestyle, solid_capstyleなど様々な指定ができる。具体例は本を見てほしいがかなりの種類の設定ができる。
17
5252「本書ではMATLAB-style」は非推奨なので...」なぜですか?driller動作が暗黙的なのでPythonの設計思想と衝突してしまいます。PythonユーザであればOOP-Styleを推奨します。
18
9-1358Cloud Datalibとはsaru999Cloud上のJupyterNoteBook。Google,Microsoft,Amazon等がある。
19
10377JupyterでRubyやRを使うメリットは?moe_honey2様々な言語でJupyterの持っている強力なインタラクティブ機能を使うことができる。例えばRの場合、Rの強力な統計機能を利用することが可能。以下はRubyの例。
https://techlife.cookpad.com/entry/201510-jupyter-and-rails
20
A392ipywidgetとは何ですか?どのような用途で使えるのですか?naisen424インタラクティブにパラメータを変化させる
21
Appendix
400スライドショーでの利用でメリット、デメリットを教えてくださいkonumaメリット。分析したものをそのまま使える。プレゼン中に編集可能
デメリット。細かい表示制御が難しい。特に改ページなど
22
Appendix
407JupyterLabってなんですか?kawamotoJupyter Notebookの後発ツール、今後が期待されている。
Webブラウザ上で、インタラクティブに操作できる。タブ機能提供されている。
23
Github上で実行結果がちゃんと表示されているのはどういう仕組みなんでしょう?drillernbconvertというさまざまな形式に変換するコマンドがあります、HTML形式のexportにも対応しており、内部でこれが動いていると想定されます。
https://help.github.com/articles/working-with-jupyter-notebook-files-on-github/
24
SeriesとDataFrameはDataFrameだけでSeriesの役割もカバーできますか?kawamotoDataFrameはSeriesの集まりともいえるので、Series無しというのはできない
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
Loading...