Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

getImages.sh kann bestimmten Tag nicht parsen #2

Open
krugbuild opened this issue Jan 30, 2020 · 0 comments
Open

getImages.sh kann bestimmten Tag nicht parsen #2

krugbuild opened this issue Jan 30, 2020 · 0 comments

Comments

@krugbuild
Copy link
Owner

Beim Einlesen der articleData.xml wirft die getImages.sh regelmäßig einen Parsererror. Auslöser ist der folgende Tag:

<li id="footer-info-copyright">本站的全部文字在<a rel="license" href="//zh.wikipedia.org/wiki/Wikipedia:CC-BY-SA-3.0%E5%8D%8F%E8%AE%AE%E6%96%87%E6%9C%AC" title="Wikipedia:CC-BY-SA-3.0协议文本">知识共享 署名-相同方式共享 3.0协议</a><a rel="license" href="//creativecommons.org/licenses/by-sa/3.0/deed.zh" style="display:none;"></a>之条款下提供,附加条款亦可能应用。(请参阅<a href="//foundation.wikimedia.org/wiki/Terms_of_Use">使用条款</a><br /> Wikipedia&reg;和维基百科标志是<a href="//wikimediafoundation.org">维基媒体基金会</a>的注册商标;维基&trade;是维基媒体基金会的商标。<br />
维基媒体基金会是按美国国內稅收法501(c)(3)登记的<a href="//wikimediafoundation.org/wiki/Tax_Deductibility/en">非营利慈善机构</a><br /></li>

Dieser Tag tritt nur in der aktuellsten Artikelversion auf und folglich auch nur im ersten articleData.xml einer Serie. Da der Tag keine relevanten Daten enthält, sollte er händisch entfernt werden.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

1 participant