Copyleft (c) 2013. Ridlo W. Wibowo <br > [email protected]
Sequence alignment adalah cara mengurutkan sequence asam amino pada DNA (Deoxyribonucleic acid), RNA (Ribonucleic acid), atau protein untuk mengidentifikasikan dearah kesamaan yang mungkin menjadi konsekuensi dari hubungan fungsional, struktural, dan evolusi antar sequence. Perkembangan algoritma dalam kasus bioinformatika sangat pesat dan tidak jarang melibatkan komputasi besar untuk keperluan tertentu, semisal pencarian pada database protein.
Program sequence alignment sederhana (PySSA) ini menggunakan bahasa python dan berisi 3 algoritma dasar: - Smith-Waterman Algorithm - Needleman-Wunsch Algorithm - Gotoh Algorithm untuk keperluan pembelajaran bioinformatika, sequence alignment pada DNA, RNA atau protein lain.
Usage:
python generalGap.py -option -input
Option:
-i input two sequence in command line argument
-g gap value, default -1
-gp gap penalty, default -1
-m match score, default +1
-mm mismatch score, default -1
-f input file, status: disable [under construction]
Example:
python generalGap.py -i ACACACTA AGCACACA -g -1
Output:
General Gap Penalty, Needleman-Wunch Algorithm
SEQUENCE 1: ACACACTA
SEQUENCE 2: AGCACACA
gap : -1.0
gap penalty : -1.0
match score : 1.0
mismacth score: -1.0
-0.0 -1.0 -2.0 -3.0 -4.0 -5.0 -6.0 -7.0 -8.0
-1.0 1.0 0.0 -1.0 -2.0 -3.0 -4.0 -5.0 -6.0
-2.0 0.0 0.0 -1.0 -2.0 -3.0 -4.0 -5.0 -6.0
-3.0 -1.0 1.0 0.0 0.0 -1.0 -2.0 -3.0 -4.0
-4.0 -2.0 0.0 2.0 1.0 1.0 0.0 -1.0 -2.0
-5.0 -3.0 -1.0 1.0 3.0 2.0 2.0 1.0 0.0
-6.0 -4.0 -2.0 0.0 2.0 4.0 3.0 2.0 2.0
-7.0 -5.0 -3.0 -1.0 1.0 3.0 5.0 4.0 3.0
-8.0 -6.0 -4.0 -2.0 0.0 2.0 4.0 4.0 5.0
Sequence 1: A _ C A C A C T A
Sequence 2: A G C A C A C _ A
Score : 5.0
Untuk keperluan tugas saja.. :P