paplot documentation¶
Contents:
quick start¶
- paplotをインストール
- testサンプルでコマンドを実行
- 結果ファイルを表示
1. paplotをインストール¶
git clone -b master https://github.com/Genomon-Project/paplot.git
cd paplot
python setup.py build install --user
pa_plot conf
**********************
hello paplot !!!
**********************
config file:/usr/lib/python2.7/site-packages/paplot-0.2.6devel-py2.7.egg/config/paplot.cfg
[genome]
('path', '')
[style]
('path', '')
[sv]
('use_chrs', '1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,X,Y')
('snippet_threshold', '1000')
(このあとにデフォルト設定の内容が表示されます)
2. testサンプルでコマンドを実行¶
テストサンプルを用意していますので実行します。
cd {paplotをインストールしたディレクトリ}
# create bar graphs of qc
pa_plot qc "example/qc/*.csv" ./tmp DUMMY --config_file example/example.cfg
# create bundle graphs of Structural Variation (SV)
pa_plot sv "example/sv/*.txt" ./tmp DUMMY --config_file example/example.cfg
3. 結果ファイルを表示¶
次の場所にHTMLファイルが2つできていますか?
{paplot をインストールしたディレクトリ}
└ tmp
├ DUMMY
│ ├ graph_qc.html <--- qc グラフ
│ └ graph_sv.html <--- sv グラフ
│
├ js <--- この3つのディレクトリはHTMLファイルを表示するために必要です。消さないでください。
├ lib
└ style
tmp ディレクトリを丸ごとコピーしてください。
QC グラフ¶
SV グラフ¶
- 棒グラフでは全サンプルでbreakpointを集計した数を表示します。
- 円形のグラフでは、サンプルごとにbreakpoint1と2を線でつないで表示します。
install¶
- Linux系サーバ (HGCスパコン含), Linux ディストリビューション
- MacOS X
- Windows
Linux系の場合 (HGCスパコン, cygwin含)¶
1. paplot のインストール¶
cd {install したいディレクトリ}
git clone -b master https://github.com/Genomon-Project/paplot.git
cd paplot
python setup.py build install
# 上のコマンドでエラーが出る場合
export PATH=~/.local/bin/:$PATH
export LD_LIBRARY_PATH=~/.local/lib/:$LD_LIBRARY_PATH
python setup.py build install --user
pa_plot conf
**********************
hello paplot !!!
**********************
(デフォルト設定値が表示される)
注釈
PATH設定を忘れないようにする
~/.bashrc もしくは ~/.bash_profile ファイルに次の2行を記入してください。export PATH=~/.local/bin/:$PATH
export LD_LIBRARY_PATH=~/.local/lib/:$LD_LIBRARY_PATH
MacOS Xの場合¶
1. ソースファイルのダウンロード¶
Source code (zip) をダウンロードします。https://github.com/Genomon-Project/paplot/releases/
git コマンドが使える方は git clone -b master https://github.com/Genomon-Project/paplot.git でもよいです。2. paplot のインストール¶
whoami コマンドで確認できます。cd {downloadしたディレクトリ}
# 大抵は以下でOKです。
# cd /Users/<user name>/Downloads/paplot-devel
python setup.py build install --user
3. PATHの設定¶
pa_plot がどこにあるかわからないので、インストールされているところにPATHを通します。/Users/<user name>/Library/Python/2.7/bin
注釈
find / -name pa_plot とコマンドを入力してインストールされているところを探します。{installしたディレクトリ}/bin/pa_plot <--- ココです
{installしたディレクトリ}/lib/python2.7/site-packages/paplot-0.2.6devel-py2.7.egg/EGG-INFO/scripts/pa_plot
{downloadディレクトリ}/paplot-devel/pa_plot
{downloadディレクトリ}/paplot-devel/build/scripts-2.7/pa_plot
export PATH={installしたディレクトリ}/bin:$PATH
export LD_LIBRARY_PATH={installしたディレクトリ}/lib:$LD_LIBRARY_PATH
# 大抵は以下でOKです。
# <user name>は自分のユーザ名に置き換えてください。
# export PATH=/Users/<user name>/Library/Python/2.7/bin:$PATH
# export LD_LIBRARY_PATH=/Users/<user name>/Library/Python/2.7/lib:$LD_LIBRARY_PATH
pa_plot conf
**********************
hello paplot !!!
**********************
(デフォルト設定値が表示される)
注釈
PATH設定を忘れないようにする
export PATH=... コマンドを入力する必要があります。vi ~/.bash_profile
i と入力して編集モードにします。↓ キーで最後の行に移動します。export PATH=/Users/<user name>/Library/Python/2.7/bin:$PATH
export LD_LIBRARY_PATH=/Users/<user name>/Library/Python/2.7/lib:$LD_LIBRARY_PATH
ESC キーを押して、編集モードから抜けます。その後、:wq と入力して保存して終了します。Windows系の場合¶
1. Pythonのインストール¶
- winPython http://winpython.github.io/
- Python(x,y) http://python-xy.github.io/
2. paplot のインストール¶
Source code (zip) をダウンロードします。https://github.com/Genomon-Project/paplot/releases/
C:\\Program Files\\WinPython-64bit-3.5.1.2\\WinPython Command Prompt.exe
cd {zipを解凍したフォルダ}
python setup.py build install
pa_plot コマンドにパスが通っていないのでバッチファイルを使用します。pa_plot.cmd がありますので、ノートパッド等テキストエディタで開いて編集します。set pa_plot="C:\Program Files\WinPython-64bit-3.5.1.2\python-3.5.1.amd64\Scripts\pa_plot"
>pa_plot.cmd conf
**********************
hello paplot !!!
**********************
(デフォルト設定値が表示される)
pa_plot コマンドは pa_plot.cmd と読み替えてください。pa_plot コマンド¶
1. コマンドオプション¶
pa_plot {qc, sv} [-h] [--version] [--config_file CONFIG_FILE] [--remarks REMARKS] input output_dir project_name
必須
{qc, sv}paplotのサブコマンドです。どちらかを選択します。
input入力ファイルです。ワイルドカード (
*) を使用して複数指定することができます。最初と最後に"をつけてください。output_dir出力ディレクトリを指定します。ディレクトリ構成は 2. 出力ディレクトリ を参照してください。
project_nameプロジェクト名です。出力ファイルのタイトルに使用します。
任意
--config_file設定ファイルです。未指定の場合、デフォルトを使用します。
--remarksindex.htmlの備考欄に出力するテキストです。未指定の場合、設定ファイルの値を使用します。
その他
-hヘルプを表示します。
--versionバージョンを表示します。
2. 出力ディレクトリ¶
output_dir オプションで指定した場所に次の構成でファイルを出力します。
{output_dir}
├ {project_name}
│ ├ graph_qc.html <--- qc グラフ
│ └ graph_sv.html <--- sv グラフ
│
├ js <--- この3つのディレクトリはHTMLファイルを表示するために必要です。消さないでください。
├ lib
├ style
│
└ index.html <--- index このファイルをブラウザで開いてください。
出力ファイルを移動する場合は {output_dir} ごと移動してください。
出力ファイルの操作方法は QC グラフ を参照してください。
自分のデータを使用する¶
自分のデータを使用するにはconfigファイルを編集して自分のファイルフォーマットを指定します。
configファイルのサンプルは以下にあります。
{paplotをインストールしたディレクトリ}/example/example.cfg
[genome]
# ゲノムサイズのファイル(CSV形式)(デフォルトはhg19, installディレクトリ配下のgenomeディレクトリにあります)
#
# for example.
# (linux)
# path = ~/tmp/genome/hg19.csv
# (windows)
# path = C:\genome\hg19_part.csv
path =
[style]
# グラフのレイアウトファイル
# ~/tmp/paplot/style/rainbow.js
path =
# index.html の備考欄に出力するテキスト(HTMLタブ使用可)
remarks =
[sv]
# 使用するchromosomes (,で区切る)
use_chrs = 1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,X,Y
[qc]
# qcでどのグラフを表示するか (表示しない場合Falseにする)
chart_coverage=True
chart_average=True
chart_mapped=True
chart_insert=True
chart_duplicate=True
chart_length=True
[result_format_sv]
# sv の入力ファイルフォーマット
# suffix (col_pos_IDが指定されていない場合、ファイル名のsuffixより前をIDとする)
suffix = .result.txt
# データ区切り(タブ区切りの場合)
sept = \t
# ,区切りの場合
sept = ,
# スペース区切りの場合
sept = " "
# 先頭1行がヘッダかどうか (先頭行がヘッダの場合はTrue)
header = False
# 先頭に指定文字がある行は飛ばす
comment = #
##### データ列の位置
# ヘッダ行がある場合、カラム名 (テキスト) を入力する
# ヘッダ行がない場合、カラムインデックス (数値) を入力する
# 必須
col_chr1 = Chr_1
col_break1 = Pos_1
col_chr2 = Chr_2
col_break2 = Pos_2
# 任意
col_opt_dir1 = Dir_1
col_opt_dir2 = Dir_2
col_opt_type = Variant_Type
col_opt_gene_name1 = Gene_1
col_opt_gene_name2 = Gene_2
[result_format_qc]
# qc の入力ファイルフォーマット
# (svとほぼ同)
suffixとID
列と設定の対応¶
SVの場合
| name | input type | required | description |
|---|---|---|---|
| col_chr1 | text | o | chromosome of break point 1 |
| col_break1 | numeric | o | position of break point 1 |
| col_chr2 | text | o | chromosome of break point 2 |
| col_break2 | numeric | o | position of break point 2 |
| col_opt_ID | text | x | サンプルを識別できる名称 |
| col_opt_dir1 | text | x | direction of break point 1 |
| col_opt_dir2 | text | x | direction of break point 2 |
| col_opt_type | text | x | type of variation |
| col_opt_gene_name1 | text | x | gene name of break point 1 |
| col_opt_gene_name2 | text | x | gene name of break point 2 |
注釈
任意設定の5項目はポップアップでの詳細表示にのみ使用されます。
QCの場合
| name | input type | required | description |
|---|---|---|---|
| col_total_reads | numeric | o | number of total reads |
| col_mapped_reads | numeric | o | number of mapped reads |
| col_duplicate_reads | numeric | o | number of duplicate reads |
| col_mean_insert_size | numeric | o | mean of insert size |
| col_average_depth | numeric | o | average of depth |
| col_read_length_r1 | numeric | o | number of read_length_r1 |
| col_read_length_r2 | numeric | o | number of read_length_r2 |
| col_ratio_2x | 0.0~1.0 | o | coverage (depth=2) |
| col_ratio_10x | 0.0~1.0 | o | coverage (depth=10) |
| col_ratio_20x | 0.0~1.0 | o | coverage (depth=20) |
| col_ratio_30x | 0.0~1.0 | o | coverage (depth=30) |
| col_opt_ID | text | x | サンプルを識別できる名称 |
作成したconfigファイルは pa_plot コマンドの --config_file オプションで指定します。
実行例
pa_plot qc "example/qc/*.csv" ./tmp DUMMY --config_file example/example.cfg
グラフをカスタマイズする¶
1. 変更方法¶
色やテキストなど、グラフの見た目はある程度変更することができます。
サンプルデータを用意していますので変更してみます。
1-1. スタイルファイルを編集する¶
{paplotをインストールしたディレクトリ}/example/default.js
このファイルをコピーして {paplotをインストールしたディレクトリ}/example/mystyle.js というファイルを作成します。
※ファイル名は任意ですが、拡張子は .js にしてください。
作成したファイルを開いて次の箇所を変更します。
今回はqcグラフのcoverage グラフの色を変更します。
// 7行目
// 変更前
bar_coverage_color: [
"#1F77B4", // ratio_30x
"#FF7F0E", // ratio_20x
"#2CA02C", // ratio_10x
"#D62728", // ratio_2x
],
// 変更後
bar_coverage_color: [
"blue", // ratio_30x
"pink", // ratio_20x
"#CCFF66", // ratio_10x
"#330066", // ratio_2x
],
注釈
色の指定はRGBもしくは色名で指定することができます。
// RGBで指定する場合
bar_select_color: "#1F77B4",
// color nameで指定する場合
bar_select_color: "red",
RGBで指定する場合
00~FF まで、6桁の16進表記で指定し、先頭に # をつけてください。色名(カラーネーム)について
1-2. 設定ファイルを編集する¶
{paplotをインストールしたディレクトリ}/example/example.cfg
このファイルを開いて次の箇所を変更します。
スタイルファイルを今回作成したものを使用するように変更します。
[style]
path = {paplotをインストールしたディレクトリ}/example/mystyle.js
# ~/tmpにインストールした場合はこのようになる
# ~/tmp/paplot/example/mystyle.js
1-3. 出力する¶
cd {paplotをインストールしたディレクトリ}
pa_plot qc "example/qc/*.csv" ./tmp STYLE --config_file example/example.cfg
作成されたHTMLファイルをブラウザで開いてください。
次のようにQCのcoverageグラフの色が変更されていますか?
1-4. 出力されたファイルを変更する¶
上で作成したファイルは次のディレクトリにコピーされています。
すでにpaplotで出力したHTMLファイルを変更する場合、スタイルファイル (mystyle.js) を編集し、再読み込み(ブラウザで F5 )すれば反映されます。
./tmp
├ STYLE
│ ├ graph_qc.html
│ └ graph_sv.html
│
├ js
├ lib
└ style
├ default.js <--- デフォルト
└ mystyle.js <--- 今回作成したファイル
about install¶
pa_plot conf でエラー¶
$ pa_plot conf
-bash: /usr/bin/pa_plot: No such file or directory
LD_LIBRARY_PATH の設定が正しくありません。$ pa_plot conf
Traceback (most recent call last):
File "/usr/bin/pa_plot", line 4, in <module>
__import__('pkg_resources').run_script('paplot===0.2.7devel', 'pa_plot')
(省略)
pkg_resources.DistributionNotFound: The 'paplot===0.2.7devel' distribution was not found and is required by the application
pa_plot ファイルがない場合はインストールが成功していない可能性があります。$ python setup.py build install
(最後の3行)
Installed /usr/lib/python2.7/site-packages/paplot-0.2.7devel-py2.7.egg
Processing dependencies for paplot===0.2.7devel
Finished processing dependencies for paplot===0.2.7devel
about graphs¶
グラフを画像で保存したい¶
- ブラウザのアドオンを使用する。
代表的なアドオン
- firefox ... Screengrab
- chrome ... Full Page Screen Capture
- OS 標準アプリケーション
- Windows ... Snipping Tool (「スタート」→「すべてのプログラム」→「アクセサリ」→「Snipping Tool」)
- MacOSX ... グラブ (Finder → 「移動」メニュー → 「アプリケーション」を選択 → 「ユーティリティ」ディレクトリを開く → 「グラブ」)
グラフの色が黒くなる¶
{html出力ディレクトリ}/style/default.js にあります。svでchr10の設定が不足している例。
SVで表示するchromosomeを限定するにはどうしたらよいか¶
configファイルで次の項目を編集してください。
[sv]
# 使用するchromosomes (,で区切る)
# default
# use_chrs = 1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,X,Y
# chromosome 1,5,7を使用する場合
use_chrs = 1,5,7
編集したconfigファイルは次のようにしてコマンドから指定します。
pa_plot {input files} {output directory} {title} --config_file {config file}
SVでヒト以外のゲノムを使用するにはどうしたらよいか¶
genomeサイズが入力されたファイルが必要です。
先頭列にchromosome名、2列目にサイズをカンマ , 区切りで入力してください。
1,249250621
2,243199373
3,198022430
7,159138663
8,146364022
X,141213431
Y,135534747
9_gl000201_random,36148
11_gl000202_random,40103
17_gl000204_random,81310
17_gl000205_random,174588
Un_gl000214,137718
chromosome名は分析したいファイルのChr1, Chr2で使用されている名称と同じでなければなりません。
configファイルで用意したゲノムサイズのファイルを指定してください。
[genome]
# ゲノムサイズのファイル(CSV形式)(デフォルトはhg19, installディレクトリ配下のgenomeディレクトリにあります)
#
# for example.
# (linux)
# path = ~/tmp/genome/hg19.csv
# (windows)
# path = C:\genome\hg19_part.csv
path = {ここにゲノムサイズのファイルのパスを指定する}
編集したconfigファイルは次のようにしてコマンドから指定します。
pa_plot {input files} {output directory} {title} --config_file {config file}