ロングリードからSVを検出するプロセスを高速化する rMFilter
ロングリードシークエンシング技術は、ゲノムの構造変異(SV)をより正確に調べる新しい機会を提供する。 しかし、最先端のSVコールパイプラインは計算量が多く、ロングリードのアプリケーションには制限がある。著者らは、局所ゲノム領域内の短いトークンマッチに基づいて、キメラのノイジーなロングリードを効率的に特定するために、 region match-based filter(rMFilter)を提案する。rMFilterは潜在的なSV上をスパニングしているリードを直接フィルタリングすることにより、SVコールパイプライン全体の効率を改善する。 このフィルタリングは、リファレンスゲノム中のリード領域と局所領域との間の短いトークン一致の分析に基づく。 このフィルタ処理により、SVコールパイプラインに入力されたリードの数を大幅に減らすことができる。 一方、SV上をスパニングしているリードの大部分は保持することができる。
rMFilterは、有効性を失うことなく、ロングリードベースのSV呼び出しパイプラインを加速することができる。またSV研究を容易にするために、現在のロングリードベースのパイプラインに容易に統合することができる。
>||
aa
||<
インストール
https://github.com/hitbc/rMFilter
git clone https://github.com/hitbc/rMFilter.git
cd rMFilter/src/
make
> ./rMFilter-indexer
$ ./rMFilter-indexer
__ __ _____ _ _
/ \_/ \ | ___| |_| | | _
_ _ | - - | | |___ _ | | _| |_ ___ _ _
| ^_|| | | | | | | ___| | | | | |_ _| / _ \ | ^_|
| | | | | | | | | | | | | | | |_ | __/ | |
|_| |_| |_| |_| |_| |_| |_| \___/ \___| |_|
rMFilter: Acceleration of long read-based structure variation calling by chimeric read filtering.
Program: Index
Version: V1.0
Contact: tjiang <tjiang@hit.edu.cn>
Usage: Index [Options] <HashIndexDir> <Reference>
Options: -h, --help help
-k, --kmerSize <int> kmer size of hash index [15]
> ./rMFilter-aligner
r$ ./rMFilter-aligner
__ __ _____ _ _
/ \_/ \ | ___| |_| | | _
_ _ | - - | | |___ _ | | _| |_ ___ _ _
| ^_|| | | | | | | ___| | | | | |_ _| / _ \ | ^_|
| | | | | | | | | | | | | | | |_ | __/ | |
|_| |_| |_| |_| |_| |_| |_| \___/ \___| |_|
rMFilter: Acceleration of long read-based structure variation calling by chimeric read filtering.
Program: Alignment
Version: V1.0
Contact: tjiang <tjiang@hit.edu.cn>
Usage: Alignment [Options] <HashIndexDir> <Reads>
Options: -h, --help help
-t, --threads <int> number of threads [1]
-r, --ratio <int> candidate ratio [0.05]
-k, --kmerSize <int> kmer size of hash index [15]
ラン
1、indexを作成する。
mkdir index #出力フォルダを作成
rMFilter-indexer --kmerSize 15 index/ reference.fa
- -k, --kmerSize [INT] The size of the k-mers extracted from the reference genome for indexing. [15]
2、アライメントとフィルタリングを実行する。
rMFilter-aligner --kmerSize 15 -t 20 index/ long_reads.fq
rHAT-alignerと同じくsegmentation errorを起こした。改善したら追記します。
>||
ここにソースを書く
||<
引用
rMFilter: acceleration of long read-based structure variation calling by chimeric read filtering.
Bioinformatics. 2017 Sep 1;33(17):2750-2752.
Liu B, Jiang T, Yiu SM, Li J, Wang Y