-
Notifications
You must be signed in to change notification settings - Fork 11
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
同样的输入文件多次运行得到的结果不一致 #14
Comments
默认是随机取5x的hifi reads(全用可能太慢)去检测串联重复,可能是随机性导致的,可以提高数据量(参数 |
你这个N也都很低,说明只有少量几条reads检测到了这个串联重复。 |
好咧,那我指定-subsample_n 试试,稍后回复您。 另,这里的注释是什么意思呀? |
N是cluster的基序数量,L是基序长度,ratio是累计长度占比,就是在基因组中的大致比例,另两个是聚类相关的。 |
请问ratio是怎么算的呢? 不知道是哪里出了问题呢? |
ratio是基于reads算的,motif总长度除以reads总长度(motif是从reads中鉴定的)。 |
想知道centromics软件运行时,具体是怎么运行得出这些结果的 |
可以读下代码。。 |
对对,我意思是在哪里可以看到代码 |
代码就在这个github仓库。 |
感谢感谢!(新手问题有点愚蠢,请见谅)
|
你可以调聚类参数让它们聚成一个。 |
您好!非常感谢您的工作!
我用同样的输入文件,hic、hifi和genome,其他参数默认,运行了两次,得出来的结果不一致。我将两次得到的数量最多的CL进行了blastn,它们相似性也很低。
第一次最多的CL是:
`
第二次最多的CL是:
`
`
它们在染色体的位置是相似的。
请问这是什么原因呢?
谢谢!
The text was updated successfully, but these errors were encountered: