-
Notifications
You must be signed in to change notification settings - Fork 5
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
fix schemaLocation syntax for ALTO ns #15
Conversation
But I'll probably add a few more commits to allow selecting a different (older) ALTO version – if you don't mind @kba? |
I do not :) Just give me the heads-up when it's ready. |
There's a problem though: Some breaking schema changes of the past have neither been reflected in a new namespace name or a new namespace version. Example:
|
Background BTW: kitodo/kitodo-presentation#488 |
I see no other way than to do a conditional |
Yes. Luckily we decided to do all that in Python – and not impoverished XSLT |
Thinking about it: in this direction, it's not a problem at all: we always get strings that can only be interpreted as |
Done.
--- /dev/fd/63 2021-06-17 19:25:15.685117779 +0200
+++ /dev/fd/62 2021-06-17 19:25:15.685117779 +0200
@@ -1,5 +1,5 @@
<?xml version='1.0' encoding='UTF-8' standalone='yes'?>
-<alto xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="http://www.loc.gov/standards/alto/ns-v4#" xsi:schemaLocation="http://www.loc.gov/standards/alto/ns-v4# http://www.loc.gov/standards/alto/v2/alto-2-0.xsd">
+<alto xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="http://www.loc.gov/standards/alto/ns-v4#" xsi:schemaLocation="http://www.loc.gov/standards/alto/ns-v4# http://www.loc.gov/standards/alto/v4/alto-4-1.xsd" SCHEMAVERSION="4.1">
<Description>
<MeasurementUnit>pixel</MeasurementUnit>
<sourceImageInformation>
@@ -7,6 +7,9 @@
</sourceImageInformation>
</Description>
<Styles/>
+ <Tags>
+ <LayoutTag ID="layouttag-paragraph" LABEL="paragraph"/>
+ </Tags>
<Layout>
<Page ID="None" PHYSICAL_IMG_NR="0" WIDTH="2621" HEIGHT="2621">
<TopMargin VPOS="0" HPOS="0" HEIGHT="0" WIDTH="0"/>
@@ -15,13 +18,33 @@
<BottomMargin VPOS="0" HPOS="0" HEIGHT="0" WIDTH="0"/>
<PrintSpace>
<TextBlock ID="r0" HEIGHT="2130" WIDTH="1546" HPOS="190" VPOS="366" TAGREFS="layouttag-paragraph" IDNEXT="r1">
+ <Shape>
+ <Polygon POINTS="190,366 190,2496 1736,2496 1736,366"/>
+ </Shape>
<TextLine ID="r0-dummy-TextLine" HEIGHT="2130" WIDTH="1546" HPOS="190" VPOS="366">
- <String ID="r0-dummy-TextLine-dummy-Word" HEIGHT="2130" WIDTH="1546" HPOS="190" VPOS="366" CONTENT="übrigens denken, dass Sie aus diesem Vorfall Sich nur das Gute ziehen würden, wie es denn auch geschehen. Es freut mich, dass Sie Sich so dem trockenen Studium hingegeben, es muss eben auch sein, und trägt für später die schönsten Früchte. Was helfen die schönen, poetischen Gedanken, wenn man sie nicht zu behandeln weiss, die Instrumente Alle, wenn man nicht versteht sie mit Maass anzuwenden – damit erdrückt man seine schönsten Gedanken, macht sie ungeniessbar. Dies empfand ich namentlich auch bei Ihren Gesangssachen, die, so innig gedacht sie waren, gesungen unmöglich einen erquicklichen Eindruck machen konnten. Ich denke, das haben Sie jetzt auch eingesehen. "/>
+ <Shape>
+ <Polygon POINTS="190,366 190,2496 1736,2496 1736,366"/>
+ </Shape>
+ <String ID="r0-dummy-TextLine-dummy-Word" HEIGHT="2130" WIDTH="1546" HPOS="190" VPOS="366" CONTENT="übrigens denken, dass Sie aus diesem Vorfall Sich nur das Gute ziehen würden, wie es denn auch geschehen. Es freut mich, dass Sie Sich so dem trockenen Studium hingegeben, es muss eben auch sein, und trägt für später die schönsten Früchte. Was helfen die schönen, poetischen Gedanken, wenn man sie nicht zu behandeln weiss, die Instrumente Alle, wenn man nicht versteht sie mit Maass anzuwenden – damit erdrückt man seine schönsten Gedanken, macht sie ungeniessbar. Dies empfand ich namentlich auch bei Ihren Gesangssachen, die, so innig gedacht sie waren, gesungen unmöglich einen erquicklichen Eindruck machen konnten. Ich denke, das haben Sie jetzt auch eingesehen. ">
+ <Shape>
+ <Polygon POINTS="190,366 190,2496 1736,2496 1736,366"/>
+ </Shape>
+ </String>
</TextLine>
</TextBlock>
<TextBlock ID="r1" HEIGHT="2403" WIDTH="1636" HPOS="120" VPOS="83" TAGREFS="layouttag-paragraph">
+ <Shape>
+ <Polygon POINTS="1753,83 1756,340 180,336 180,2486 120,2483 123,120 583,120 1116,93"/>
+ </Shape>
<TextLine ID="r1-dummy-TextLine" HEIGHT="2403" WIDTH="1636" HPOS="120" VPOS="83">
- <String ID="r1-dummy-TextLine-dummy-Word" HEIGHT="2403" WIDTH="1636" HPOS="120" VPOS="83" CONTENT="Wie weit sind Sie mit Ihrem Sextett? Waren Sie schon in Paris? Was haben Sie dort Musikalisches erlebt? – Meinen Bruder haben Sie wohl im Harz gesehen? "/>
+ <Shape>
+ <Polygon POINTS="1753,83 1756,340 180,336 180,2486 120,2483 123,120 583,120 1116,93"/>
+ </Shape>
+ <String ID="r1-dummy-TextLine-dummy-Word" HEIGHT="2403" WIDTH="1636" HPOS="120" VPOS="83" CONTENT="Wie weit sind Sie mit Ihrem Sextett? Waren Sie schon in Paris? Was haben Sie dort Musikalisches erlebt? – Meinen Bruder haben Sie wohl im Harz gesehen? ">
+ <Shape>
+ <Polygon POINTS="1753,83 1756,340 180,336 180,2486 120,2483 123,120 583,120 1116,93"/>
+ </Shape>
+ </String>
</TextLine>
</TextBlock>
</PrintSpace> |
@kba this is ready to merge AFAICT. (Would be nice to have automatic schema validation against the different versions in your testset, but I'll leave that to your diligent hands :-) |
@bertsky For
The namespace is still |
Additionally, I tried to validate v2 files you generated and
|
Indeed, I forgot to adapt the namespace name as well. Thanks for spotting!
That one slipped through, sry. Late at work!
That's harder. This was already broken before. @kba your |
@Erikmitk I fixed the three issues you found. |
True, since |
No, but because we simply don't ever generate decimal points (and |
Happy to announce that |
Fixes #14.