Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

新增getchu官网刮削,支持同人和里番 #279

Closed
wants to merge 7 commits into from
Closed

新增getchu官网刮削,支持同人和里番 #279

wants to merge 7 commits into from

Conversation

musnow
Copy link
Contributor

@musnow musnow commented Apr 16, 2024

新增getchu官网刮削,支持同人和里番
将整理后的文件夹加入不扫描列表

还有个自定义番号的想法,可以直接使用自定义番号列表映射一个表出来,使用特定的刮削模块处理后返回即可。
因为有些fc2和getchu作者会使用自行定义的“番号”,常见于同人cosplay作品比如cosh、pnme、CP等等,并非统一、正规的“番号”。
我打算将切削模块的parse_data方法改造一下,原来的数据不变但会return movie到新的自定义模块中。
如果作者觉得可行我会提交pr

@Yuukiy
Copy link
Owner

Yuukiy commented Apr 16, 2024

dl_getchu.py 不能满足需求么

@glyh
Copy link
Collaborator

glyh commented Apr 17, 2024

有可能不属于这个repo的范畴……

怎么说呢,这种综合性的爬虫,要做到专业就很难做到一般性。现在我们的codebase里全是各种特判,我不觉得适合提供一个通用的接口

@musnow
Copy link
Contributor Author

musnow commented Apr 17, 2024

dl_getchu.py 不能满足需求么

https://dl.getchu.com/
https://www.getchu.com/
这两个网站属于不同体系,但是内容涵盖是相似的,可以理解成www.getchu.com是dl.getchu.com的超集。
在cosh的作者“こすっち”在dl.getchu.com主页查看缺少很多内容均在www.getchu.com有记录,比如cosh-026、cosh-035、cosh-046等。
所以在思量后提交的pr,仔细看过检索内容还发现里番内容也是类似的情况。
https://www.getchu.com/php/search.phtml?search_keyword=&list_count=30&sort=update_date&sort2=down&search_title=&search_brand=&search_person=&search_jan=&search_isbn=&genre=all&start_date=&end_date=&age=&list_type=list&search=1&search_brand_id=102684&pageID=1
https://dl.getchu.com/search/dojin_circle_detail.php?id=5166&category_id=49&set_category_flag=2

@musnow
Copy link
Contributor Author

musnow commented Apr 17, 2024

有可能不属于这个repo的范畴……

怎么说呢,这种综合性的爬虫,要做到专业就很难做到一般性。现在我们的codebase里全是各种特判,我不觉得适合提供一个通用的接口

这个想法可以理解,但是在公网bt下的内容一般都是记录这些所谓的“番号”,自行转换id的话确实也很麻烦。

@musnow musnow closed this Jul 4, 2024
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging this pull request may close these issues.

3 participants