From fcf5b97238f16e53e6b97f6eb64425ab9f18bb8b Mon Sep 17 00:00:00 2001
From: Nils Lehmann <nils.lehmann24@gmail.com>
Date: Mon, 10 Feb 2025 17:35:29 +0000
Subject: [PATCH 1/8] dataset

---
 docs/api/datasets.rst                         |   5 +
 docs/api/datasets/non_geo_datasets.csv        |   1 +
 .../data/dior/Annotations/trainval/000000.xml |   1 +
 .../data/dior/Annotations/trainval/000001.xml |   1 +
 .../data/dior/Annotations/trainval/000002.xml |   1 +
 .../data/dior/Annotations/trainval/000003.xml |   1 +
 .../data/dior/Annotations/trainval/000004.xml |   1 +
 .../data/dior/Annotations/trainval/000005.xml |   1 +
 tests/data/dior/Annotations_trainval.zip      | Bin 0 -> 2012 bytes
 tests/data/dior/Images/test/000000.jpg        | Bin 0 -> 1217 bytes
 tests/data/dior/Images/test/000001.jpg        | Bin 0 -> 1238 bytes
 tests/data/dior/Images/trainval/000000.jpg    | Bin 0 -> 1240 bytes
 tests/data/dior/Images/trainval/000001.jpg    | Bin 0 -> 1246 bytes
 tests/data/dior/Images/trainval/000002.jpg    | Bin 0 -> 1244 bytes
 tests/data/dior/Images/trainval/000003.jpg    | Bin 0 -> 1243 bytes
 tests/data/dior/Images/trainval/000004.jpg    | Bin 0 -> 1238 bytes
 tests/data/dior/Images/trainval/000005.jpg    | Bin 0 -> 1242 bytes
 tests/data/dior/Images_test.zip               | Bin 0 -> 2511 bytes
 tests/data/dior/Images_trainval.zip           | Bin 0 -> 7440 bytes
 tests/data/dior/data.py                       | 171 ++++++++
 tests/data/dior/sample_df.parquet             | Bin 0 -> 3186 bytes
 tests/datasets/test_dior.py                   | 107 +++++
 torchgeo/datasets/dior.py                     | 393 ++++++++++++++++++
 23 files changed, 683 insertions(+)
 create mode 100644 tests/data/dior/Annotations/trainval/000000.xml
 create mode 100644 tests/data/dior/Annotations/trainval/000001.xml
 create mode 100644 tests/data/dior/Annotations/trainval/000002.xml
 create mode 100644 tests/data/dior/Annotations/trainval/000003.xml
 create mode 100644 tests/data/dior/Annotations/trainval/000004.xml
 create mode 100644 tests/data/dior/Annotations/trainval/000005.xml
 create mode 100644 tests/data/dior/Annotations_trainval.zip
 create mode 100644 tests/data/dior/Images/test/000000.jpg
 create mode 100644 tests/data/dior/Images/test/000001.jpg
 create mode 100644 tests/data/dior/Images/trainval/000000.jpg
 create mode 100644 tests/data/dior/Images/trainval/000001.jpg
 create mode 100644 tests/data/dior/Images/trainval/000002.jpg
 create mode 100644 tests/data/dior/Images/trainval/000003.jpg
 create mode 100644 tests/data/dior/Images/trainval/000004.jpg
 create mode 100644 tests/data/dior/Images/trainval/000005.jpg
 create mode 100644 tests/data/dior/Images_test.zip
 create mode 100644 tests/data/dior/Images_trainval.zip
 create mode 100644 tests/data/dior/data.py
 create mode 100644 tests/data/dior/sample_df.parquet
 create mode 100644 tests/datasets/test_dior.py
 create mode 100644 torchgeo/datasets/dior.py

diff --git a/docs/api/datasets.rst b/docs/api/datasets.rst
index d01a91dfe70..746b0151e4c 100644
--- a/docs/api/datasets.rst
+++ b/docs/api/datasets.rst
@@ -273,6 +273,11 @@ DFC2022
 
 .. autoclass:: DFC2022
 
+DIOR
+^^^^
+
+.. autoclass:: DIOR
+
 
 Digital Typhoon
 ^^^^^^^^^^^^^^^
diff --git a/docs/api/datasets/non_geo_datasets.csv b/docs/api/datasets/non_geo_datasets.csv
index 1defcb032bd..c064a3da1b4 100644
--- a/docs/api/datasets/non_geo_datasets.csv
+++ b/docs/api/datasets/non_geo_datasets.csv
@@ -13,6 +13,7 @@ Dataset,Task,Source,License,# Samples,# Classes,Size (px),Resolution (m),Bands
 `Kenya Crop Type`_,S,Sentinel-2,"CC-BY-SA-4.0","4,688",7,"3,035x2,016",10,MSI
 `DeepGlobe Land Cover`_,S,DigitalGlobe +Vivid,-,803,7,"2,448x2,448",0.5,RGB
 `DFC2022`_,S,Aerial,"CC-BY-4.0","3,981",15,"2,000x2,000",0.5,RGB
+`DIOR`_,OD,Aerial,"CC-BY-SA","23,463",20,"800x800",0.5,RGB
 `Digital Typhoon`_,"C, R",Himawari,"CC-BY-4.0","189,364",8,512,5000,Infrared
 `ETCI2021 Flood Detection`_,S,Sentinel-1,-,"66,810",2,256x256,5--20,SAR
 `EuroSAT`_,C,Sentinel-2,"MIT","27,000",10,64x64,10,MSI
diff --git a/tests/data/dior/Annotations/trainval/000000.xml b/tests/data/dior/Annotations/trainval/000000.xml
new file mode 100644
index 00000000000..9cf3dcb4484
--- /dev/null
+++ b/tests/data/dior/Annotations/trainval/000000.xml
@@ -0,0 +1 @@
+<annotation><filename>000000.jpg</filename><size><width>32</width><height>32</height><depth>3</depth></size><object><name>stadium</name><bndbox><xmin>5</xmin><ymin>11</ymin><xmax>17</xmax><ymax>21</ymax></bndbox></object><object><name>stadium</name><bndbox><xmin>13</xmin><ymin>2</ymin><xmax>22</xmax><ymax>22</ymax></bndbox></object><object><name>airplane</name><bndbox><xmin>9</xmin><ymin>0</ymin><xmax>19</xmax><ymax>16</ymax></bndbox></object></annotation>
\ No newline at end of file
diff --git a/tests/data/dior/Annotations/trainval/000001.xml b/tests/data/dior/Annotations/trainval/000001.xml
new file mode 100644
index 00000000000..e4a7f1f133a
--- /dev/null
+++ b/tests/data/dior/Annotations/trainval/000001.xml
@@ -0,0 +1 @@
+<annotation><filename>000001.jpg</filename><size><width>32</width><height>32</height><depth>3</depth></size><object><name>baseballfield</name><bndbox><xmin>5</xmin><ymin>0</ymin><xmax>23</xmax><ymax>20</ymax></bndbox></object><object><name>basketballcourt</name><bndbox><xmin>9</xmin><ymin>9</ymin><xmax>24</xmax><ymax>28</ymax></bndbox></object></annotation>
\ No newline at end of file
diff --git a/tests/data/dior/Annotations/trainval/000002.xml b/tests/data/dior/Annotations/trainval/000002.xml
new file mode 100644
index 00000000000..8f6a8784a50
--- /dev/null
+++ b/tests/data/dior/Annotations/trainval/000002.xml
@@ -0,0 +1 @@
+<annotation><filename>000002.jpg</filename><size><width>32</width><height>32</height><depth>3</depth></size><object><name>expresswayservicearea</name><bndbox><xmin>1</xmin><ymin>5</ymin><xmax>15</xmax><ymax>24</ymax></bndbox></object><object><name>harbor</name><bndbox><xmin>8</xmin><ymin>1</ymin><xmax>21</xmax><ymax>27</ymax></bndbox></object><object><name>chimney</name><bndbox><xmin>1</xmin><ymin>8</ymin><xmax>26</xmax><ymax>26</ymax></bndbox></object></annotation>
\ No newline at end of file
diff --git a/tests/data/dior/Annotations/trainval/000003.xml b/tests/data/dior/Annotations/trainval/000003.xml
new file mode 100644
index 00000000000..012639937ee
--- /dev/null
+++ b/tests/data/dior/Annotations/trainval/000003.xml
@@ -0,0 +1 @@
+<annotation><filename>000003.jpg</filename><size><width>32</width><height>32</height><depth>3</depth></size><object><name>expresswayservicearea</name><bndbox><xmin>5</xmin><ymin>2</ymin><xmax>23</xmax><ymax>16</ymax></bndbox></object><object><name>bridge</name><bndbox><xmin>11</xmin><ymin>7</ymin><xmax>22</xmax><ymax>21</ymax></bndbox></object></annotation>
\ No newline at end of file
diff --git a/tests/data/dior/Annotations/trainval/000004.xml b/tests/data/dior/Annotations/trainval/000004.xml
new file mode 100644
index 00000000000..cb58b98b9d0
--- /dev/null
+++ b/tests/data/dior/Annotations/trainval/000004.xml
@@ -0,0 +1 @@
+<annotation><filename>000004.jpg</filename><size><width>32</width><height>32</height><depth>3</depth></size><object><name>baseballfield</name><bndbox><xmin>11</xmin><ymin>14</ymin><xmax>20</xmax><ymax>25</ymax></bndbox></object><object><name>bridge</name><bndbox><xmin>4</xmin><ymin>6</ymin><xmax>21</xmax><ymax>23</ymax></bndbox></object><object><name>basketballcourt</name><bndbox><xmin>7</xmin><ymin>12</ymin><xmax>19</xmax><ymax>31</ymax></bndbox></object></annotation>
\ No newline at end of file
diff --git a/tests/data/dior/Annotations/trainval/000005.xml b/tests/data/dior/Annotations/trainval/000005.xml
new file mode 100644
index 00000000000..97ea68e8c1d
--- /dev/null
+++ b/tests/data/dior/Annotations/trainval/000005.xml
@@ -0,0 +1 @@
+<annotation><filename>000005.jpg</filename><size><width>32</width><height>32</height><depth>3</depth></size><object><name>expresswaytollstation</name><bndbox><xmin>10</xmin><ymin>7</ymin><xmax>31</xmax><ymax>19</ymax></bndbox></object><object><name>vehicle</name><bndbox><xmin>15</xmin><ymin>12</ymin><xmax>25</xmax><ymax>29</ymax></bndbox></object></annotation>
\ No newline at end of file
diff --git a/tests/data/dior/Annotations_trainval.zip b/tests/data/dior/Annotations_trainval.zip
new file mode 100644
index 0000000000000000000000000000000000000000..ed45b6be8d01da57e770be3ce919e9adfeb1190b
GIT binary patch
literal 2012
zcmWIWW@Zs#0D*U%UQu8Mln@2dj(K_cC5a`O`FX|qB}Ivud1Z+?`T<Za9AGUsm!9ZZ
z3sicBk%2)Tmlgvs(5uMJ>7DqR?~npd>-`g4-Lq7A-(TX)i#3aoIrj4M>7$aKCX)7i
z?ei|_v#4axRX=}DYtM%SonE)Mmv4Oy?*5?p=*;;A<=6HFPjxxLXMH&LdGOQRz}cGL
z6jGWetlzcF{JFsL!p-Vuw+kxr=da1Tv#3Dw<|<~VTOS2OIa*SjJi3LJ&tMb2w7_WT
zM~>G#5stGP7io2DV(^M&dg`X|u~h2BtocWFF}yo1evLIi=0Eep*Z<>Cefs8DNW~JM
z57P<y)DYy;(g}%tO$I!z`6+@X6PMhKH496yFjF#Kw7mT8k&cW1GU9)4tMd%Bdfv=)
z%(`*y#wSla7CpG}zHOy*1%IJg|BQUM_P7vLr?4B7U;dh)rr$YBt*&_jtJA+%R~>w}
zT((k854v>g+Jvhdk_+dA)d}wCIo7G{w5sBHjKUHr+npVol8n1Die|^;CB`ypznxvR
z?7*F4@%j(dx8Eyxt^0k$(|P}jA3omVkLtm|31KNafgZd@(1S*hsC>xRq#)9Ie}(jv
zXZ_aqSih=mVPV(Xx}0AnI%n(2{$l>`2mT&&$n24Qx?-(h#np17P3na`-ST<P?H@81
zT|d8Ia-O@YpNyhq$P#PQb#u2Loz_;trYPA`a`l>dmeZcT#gzq5{;G)kzgs9hsZYhp
z>FTnzZ*>aZZ58B6T)V?XSKykIktKK75rY{5Y)_xhIHsGUoUk~pL^U?|u7AwbhY@X$
zb&kiDJ(5~l?R>iLd8p<3GnG&4<!b&u;YRhf+jlP3<wQlRF(g_qf)cRne_#Usb?Jk?
z!K-7B5*QbqSuZ}rc#;PH_UZR7O>VdpC7x<>j%&{>=}61T7Sk@vE=zUzVPZHV{aX9Q
zLJ?W_8!~+<ZHCv*-Cne8=^2F_w#4dJS6piQUR!x}FBgz2;(hXdnfgmlr5ugatwo**
zvwB6<TcQeeXBlpN=A(9Sw@}*T!)xBeTq<g<Wqos{ZQY)W%zuv<Ui+Y@+iz}j?%(GJ
zue0M({dg<mCdV$IA8!(jSrbUiegwv>z_I%)gttcB?k#7u6b&x$I$iaPVe`?n=sySd
zy|;T;x4ZF>#Os#J*9z8@`n&NQ*<5hS+1!j{zS6m0FW>JDTldtpZ-Z8jr}^6MsoPy#
zlPj7xaJ6i`da6%L{&-=~85P(2*Jo9=Zcthhcu7xYx})?t2`7;s9ot+w4lPf5SSc2y
zUnBL#aLK_#W-MlLr{-?S$`FrG+Y{WCthw%oxcW2gof|Sz^C#baI`6XWXO=U1oI4Ws
zAN=rjCR*9#_<7#Bl|XN25%jhx$lJ9Ovbhc`2(;v1S=$!C)m?6Q(oCwS%}wg^<?HUj
zT2p={%amXH>oVn<mHytcum`@<n~Ky5{Z`xhp6&paO{?Yyn%h>WO7#WEXkA+TY3HYH
z78fQ}33NGXgvXi(%0IU0J5;p1^zM^)a}BdAnVlR<%U;9?NTlVmS}UhCS6||Gx|gic
zoDspbxHB=N%s12OkRdZ)PHX*yOM4gIKd_C-C{D04TJWd5QqA9Yzy!?5B*Kil*amtT
z2m~13I)Z2%g*eOz?8P`pBM2;MGzOAbjX)IY2=_n?LoX@8CV>r;1;zw!!@%Vxx?$+0
z62h>5cnt%WQRs%DXLf{PUzqT@44n1R4MWdW2*YkL<1-AL$IuN!Ppb&S&a>b%44iTU
Tyjj^m8rXqQ5a^MutRNl$sBrII

literal 0
HcmV?d00001

diff --git a/tests/data/dior/Images/test/000000.jpg b/tests/data/dior/Images/test/000000.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..55cd3f2144b2a670c1573350806a94298dc90abe
GIT binary patch
literal 1217
zcmex=<NpH&0WUXCHwH#V1_nkTWcYuZ!I^=Bjg6g+m4ls~os*M;i${c)hnt&6Qb?Fz
zL{>^(PF6}rMnOeST|r4lSw=>~TvNxu(8R<<Uft5x!pKI?*u)5A2qPyaCl5D|1TU|I
zk)n*E5y{~H0R}-11_cHMW=16jCP7AKLB{__803NOWMu>c1}I=;VrF4wW9Q)H;sz?%
zD!{<R$jr>d!pzFb!U9xX3zTPI5o8roG<0MW4oqZMDikqloVbuf*=gfJ(V&YTRE(2~
znmD<{#3dx9RMpfqG__1j&CD$<t(;w4-P}Dqy@EqR!@?sXqmoln)6z3Cvx-Yf%gQS%
ztD0L{+uA!iyCzMZGIiSY88c@sTD)ZGvgIpQuG+MD%hqk%ckJAC=<t!F$Bv&kdFs;T
zD_5^wzj5={!$*&wJbm{3#miS8KYjl4_1pI!KYxMz#mK-6@fMJTcnr;7f<S*Uv9K_+
zu!H=?$W#u*%z`YeiiT`Lj)Clng~CckjT|CQ6Blkg$f;}`^g%SK=pvVxipfLOk07ss
zeMX$en#l4Q++zrT-D2QjW&}navmk>#L&};>w)>WDbcpUZyV0*_Y&^;7q1kU48K&FQ
zpS}-_I+?(_Ylp68d0DH3>=_X&x7i2NRJ^z6v0ZL(JfLgj%2Tw)DyeqPox7c0r@xDK
z7XCg|ZpPRnP$8L<%(_`<S&CDFu2oE1#=C3oGZYl}Jvb?QtUS*qb<=^1QYBYi&rI67
zZU4RN>$6|&OKy6;{H)q_-7mN97hm4)?|WAIwEJb%S+_J28jkg_Ph_4py}-WGfop!D
zB|F0$0oSyoS01Mv9=&>ew$gd3(6)ObyCz-@JjAo=8#@dCOkt}zF5X7c(d!gq{=Kl&
zx^HoZ@A0R;1q^n1ZEI)yZ?^GV7IV|PuBlKYF-%hQbn`~D9(Lt2e!sOZu9k&N$`4<+
zJNtR=*4N)FMHPNtk&4Z)4cm2p{oVD8onl-LzTNKh-tMsEw3h~5PyKwBImL)(?(Y$P
zR~WQpbL{PySnhNV2h}4hpYFLGz@EckWa+cw_$g22OjDNIK{t<F-_9@4d((H9IO8;d
z1%i{#9Q5k5O4+E;wmdTCu-s~E?uFXEoJ#D{ryCZq#+i$qIBxUjhJ@u2`y#!~o?EZo
z`u^#<>;3qNB9GU^l<qHkf9-GB_n%cQ1<y{u+2rz3ahvzF$ypP++KX1Qay=1X&O3NA
z?oM#r%bBw*<SHIa(tUWxpmq{Z?~_$+Eb|x{QYJ<AvwnN?dbPtO=e(zD58Ir!3~5t7
z$maZ6?C-lflMHuHysY2*?>x`8W2qJYE}d8=reY_`f9KWF36mnL@&XL!T=Xgk-mbsv
g?z?Yg_di|#@VdHda(Q>{{Izc{Z_2*>r2hX+09RA-6951J

literal 0
HcmV?d00001

diff --git a/tests/data/dior/Images/test/000001.jpg b/tests/data/dior/Images/test/000001.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..5c9f08916708f41ff161bc7837d5321e56b85043
GIT binary patch
literal 1238
zcmex=<NpH&0WUXCHwH#V1_nkTWcYuZ!I^=Bjg6g+m4ls~os*M;i${c)hnt&6Qb?Fz
zL{>^(PF6}rMnOeST|r4lSw=>~TvNxu(8R<<Uft5x!pKI?*u)5A2qPyaCl5D|1TU|I
zk)n*E5y{~H0R}-11_cHMW=16jCP7AKLB{__803NOWMu>c1}I=;VrF4wW9Q)H;sz?%
zD!{<R$jr>d!pzFb!U9xX3zTPI5o8roG<0MW4oqZMDikqloVbuf*=gfJ(V&YTRE(2~
znmD<{#3dx9RMpfqG__1j&CD$<t(;w4-P}Dqy@EqR!@?sXqmoln)6z3Cvx-Yf%gQS%
ztD0L{+uA!iyCzMZGIiSY88c@sTD)ZGvgIpQuG+MD%hqk%ckJAC=<t!F$Bv&kdFs;T
zD_5^wzj5={!$*&wJbm{3#miS8KYjl4_1pI!KYxMz#mK-6@fMJTcnr;7f<S*Uv9K_+
zu!H=?$W#u*%z`YeiiT`Lj)Clng~CckjT|CQ6Blkg$f;}`^g%SK=pvVxipfLOk07ss
zeMX$en#l4Q++zrT-D2QjW&}navmk>#L*|C2RH2(k@&XFhY|ws_6ml#i{n?!*%@f4m
zJxGz+c0Q#jYR$9>cMkoI3h%X98nnPz_V;w1)z6-M@t=~u)hye(x+iY?%x}484uyDZ
z+8wd|Ju^?f^^?gAjZ<IG^F6UnVQZxF<pld%LdK=Xr!&bsy?Z=JaP||wy0izvE{|1q
zmX`gw_3Cd`W!02dXIB^9yLIdDwBNe+x?2>tZ;dRu-TqtCZ7*Yxn9hZ1>go&)A%dT4
z_PRanQAl{1-er9wdG4+3ClwDT-tk!DwJc;oZ`Z1(k9PNt7cyH!wQ1geGqF2jR;2Hq
zzzzD_vso32qIYec;AWS~l5SzHH0f$jaipV6uE`N+mH1s9qNk_aV0!*eBY*lchV-T#
z>Tfk)ZF&9u*58sZuX8yjKlR=6>-FX5r8lFW++Px9dSidZIx$X#28S@wh(Cvpa>zQU
z^zJxURn@bC_iFCarb?c-x_ckpo|)9TF7^<U(+(8|53Us)CyucPaEGPdJ$ra^{>o_M
z*jsi#dN-%eQ+GP1qsAz2pzvqG>I6}C(Y5J<70Tj1+XEeyZa?EVa`fqqnQneX3m&U9
zd2l(z6m0SHbuYb~@AAd(m-_YED34WpzC8J|rDWIj)XlM9YWKVqTjTICc8b`eTNV!+
zbmzSB=+j#jTx=xRde6=3PqVxM%W-3lv_5P1?Pk~fnc0GzwS+$zZR)*mKCL|W<phVE
zN9$@A{eC-b_oc$8@28y5+a_r^;mm>w-mE8VR`tmK(O7YSF(`WVPW6LrkwTUy+zTGd
zygR6(kre&x!NeU2+AB3po=xhVw)*R<Z(-N&>Th_QQT?fRdg-U~pDJ(e-M;y%{{Kw?
DN>>F(

literal 0
HcmV?d00001

diff --git a/tests/data/dior/Images/trainval/000000.jpg b/tests/data/dior/Images/trainval/000000.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..04d70c662713667f5ca45d7288fbcf0ab862ae1f
GIT binary patch
literal 1240
zcmex=<NpH&0WUXCHwH#V1_nkTWcYuZ!I^=Bjg6g+m4ls~os*M;i${c)hnt&6Qb?Fz
zL{>^(PF6}rMnOeST|r4lSw=>~TvNxu(8R<<Uft5x!pKI?*u)5A2qPyaCl5D|1TU|I
zk)n*E5y{~H0R}-11_cHMW=16jCP7AKLB{__803NOWMu>c1}I=;VrF4wW9Q)H;sz?%
zD!{<R$jr>d!pzFb!U9xX3zTPI5o8roG<0MW4oqZMDikqloVbuf*=gfJ(V&YTRE(2~
znmD<{#3dx9RMpfqG__1j&CD$<t(;w4-P}Dqy@EqR!@?sXqmoln)6z3Cvx-Yf%gQS%
ztD0L{+uA!iyCzMZGIiSY88c@sTD)ZGvgIpQuG+MD%hqk%ckJAC=<t!F$Bv&kdFs;T
zD_5^wzj5={!$*&wJbm{3#miS8KYjl4_1pI!KYxMz#mK-6@fMJTcnr;7f<S*Uv9K_+
zu!H=?$W#u*%z`YeiiT`Lj)Clng~CckjT|CQ6Blkg$f;}`^g%SK=pvVxipfLOk07ss
zeMX$en#l4Q++zrT-D2QjW&}navmk>#L+8^jT|3e3TXsyl>pqib<IX-$M;lF_^fpHK
zm}v<M-dW_Hc{T0StIw`H(?0G=axZg~PT3e#mwPbsL`@3MJImZf(%sWEc(_?l27mKN
zja|8sJAK-d{dXU1P-f{#nH>IhX|rJa*7j2!@8(%tGumiq>FLbF!}K5}&qma`yHL-#
zXR7y$dAnZM{rVagws%%onAWCAdnZ5Jy!UtXdH=&@yC-luy$W{Esyno=>PSkrkieNW
z%lRZ$BuKjPaq!$YE;&!F>rrrdrq!XxOm~$ZpKh5JP&Pr(^Vaf(sfLdwUQLWTSuA@f
z^Rv<|m4{D$PIHMA;K|i17vi2jTl3R`S4NsH&8}0$o=%K2zpFmO$>?c>fbgUumWr5n
zx1#edo>-TvGNmLldRzDYslSTtcROCGdG$8y-mRDQho8)STs!wfUfio&&#c2MzDb(j
zaXERCz3^v*g=$Fdp>!P%?VTQnO@6LhI=gJ9X8K+o=CeW@(vLk_*!4+5fo1Z^;|x8V
z`MGP~zCSa4Ug>IIrByqpY_5!C-1kx1E%5W4`4dE$nbw?5Q{6f5?gImzt_`hyF_sE>
zmNB{Niwh1n85Q03TCH*Vajeynzh?g#%vXtIYwVSs{hy(&`s=0dQMy~AuXj}+-L%=7
z<sdhU%N(ysla5Z;k_<6>dN80;v0aj3;+Ck?Ip&3{-p;RDIk{vZ6Q}>oXH8{!CBc7G
zIQkjX4c)bGy4oJ?+R^7Ex<qh6V3Xw3`76`zx%)92^#~n|y5K9;_fAhPVqxzsi)-#N
ze|GzY)T}5IW1ryY#1LwlC4H(s+dJy_viJ91`+nViVz$M0iDTDa-uJfqTb=!6;{Tff
D?%?&t

literal 0
HcmV?d00001

diff --git a/tests/data/dior/Images/trainval/000001.jpg b/tests/data/dior/Images/trainval/000001.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..e6942332e32bc6a07424826c43717cd4a10519f7
GIT binary patch
literal 1246
zcmex=<NpH&0WUXCHwH#V1_nkTWcYuZ!I^=Bjg6g+m4ls~os*M;i${c)hnt&6Qb?Fz
zL{>^(PF6}rMnOeST|r4lSw=>~TvNxu(8R<<Uft5x!pKI?*u)5A2qPyaCl5D|1TU|I
zk)n*E5y{~H0R}-11_cHMW=16jCP7AKLB{__803NOWMu>c1}I=;VrF4wW9Q)H;sz?%
zD!{<R$jr>d!pzFb!U9xX3zTPI5o8roG<0MW4oqZMDikqloVbuf*=gfJ(V&YTRE(2~
znmD<{#3dx9RMpfqG__1j&CD$<t(;w4-P}Dqy@EqR!@?sXqmoln)6z3Cvx-Yf%gQS%
ztD0L{+uA!iyCzMZGIiSY88c@sTD)ZGvgIpQuG+MD%hqk%ckJAC=<t!F$Bv&kdFs;T
zD_5^wzj5={!$*&wJbm{3#miS8KYjl4_1pI!KYxMz#mK-6@fMJTcnr;7f<S*Uv9K_+
zu!H=?$W#u*%z`YeiiT`Lj)Clng~CckjT|CQ6Blkg$f;}`^g%SK=pvVxipfLOk07ss
zeMX$en#l4Q++zrT-D2QjW&}navmk>#Ls#UM7i-_Od{jNNSu3~b^v1_&bs-y%2~ODd
zc<zDc%Q$8|U3<^H{cL(;oX3;wq~9#*@AJ8Svi$kaP*TDmIDxZ|Tl4MmpNl>%p2YUs
zQBl=M_MF4v#J0C5cWe{SmYK99>A<dOKXYApPV#x#b}w-e3Z24s&Mx4z!jtspPfAqJ
z1wMN=?e?E<`=&>K346b3gXu|i`~7+Mm+sYlx{~L!%J%JI(=Nq0Y`EQ;?XP_%Sp400
zF)crl9<vW_Zfu+<^y^jMyi=WZ%VPPbsqS-}R~%q0^PD)RjlJ-^#B+(L1=Gwv-MZPN
zvcJjHWBN&VyG$O2@Fd5upNv6fJ?jh{6_;<=Stybu*86^$ME|K9rzOKqJrO;B!c4EM
zfm`O&5|J0H<Mdr`=3jkXYqsy~(%S0awWr@5HO)2IH|=iaYW2Ol)zdC-&NkiC#+#&F
zY<pyZgUiPEdSx0atr9sOxMUbqUWeR^5W8f$&GXjZS&mlQXUuS8-4Sqb)9#Qbh1;zg
zPIYZao|^CMX!T^(iGW)keX>)GEqTl}e;(s|S73Nfba9{djxQ&l?&$3)IIVwco@L?W
zC#wXU*-o>jIo)||dH4gPo57@>(CL#e?|QW*FfQv?#*xST8BeCoU7ss=x^#JTto_v_
zv2Q$=SIvC8nA=#PAk2=d_h5HIE0^UtpN5+KnybwxP2R;;v2f;*Nk>IyGO;JA+~I0C
zx@`hy&ZJWXjt5rcuFYdzbZgCYLoeM6T9QobVrTRy)=!Pjh&|E}+Gu%zbsBHUp>Otv
z>rcm=w6YB9R2Ds$)OC0g-x-$MrzTG-5Dk^9D|x?q>#qAxrf$FNe@1D&wD0bvrQb8t
M^FLR;zyJRx0P<4+d;kCd

literal 0
HcmV?d00001

diff --git a/tests/data/dior/Images/trainval/000002.jpg b/tests/data/dior/Images/trainval/000002.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..a2ee225920e65e7c5c2d7b4153e857178639508a
GIT binary patch
literal 1244
zcmex=<NpH&0WUXCHwH#V1_nkTWcYuZ!I^=Bjg6g+m4ls~os*M;i${c)hnt&6Qb?Fz
zL{>^(PF6}rMnOeST|r4lSw=>~TvNxu(8R<<Uft5x!pKI?*u)5A2qPyaCl5D|1TU|I
zk)n*E5y{~H0R}-11_cHMW=16jCP7AKLB{__803NOWMu>c1}I=;VrF4wW9Q)H;sz?%
zD!{<R$jr>d!pzFb!U9xX3zTPI5o8roG<0MW4oqZMDikqloVbuf*=gfJ(V&YTRE(2~
znmD<{#3dx9RMpfqG__1j&CD$<t(;w4-P}Dqy@EqR!@?sXqmoln)6z3Cvx-Yf%gQS%
ztD0L{+uA!iyCzMZGIiSY88c@sTD)ZGvgIpQuG+MD%hqk%ckJAC=<t!F$Bv&kdFs;T
zD_5^wzj5={!$*&wJbm{3#miS8KYjl4_1pI!KYxMz#mK-6@fMJTcnr;7f<S*Uv9K_+
zu!H=?$W#u*%z`YeiiT`Lj)Clng~CckjT|CQ6Blkg$f;}`^g%SK=pvVxipfLOk07ss
zeMX$en#l4Q++zrT-D2QjW&}navmk>#!_-T++$QWjy2R=3Ebo<JiH*v+JuB~?Wc+Zu
zGxuo2la#JroeA8vR`2d-`OeIp>!qU=tbFDLo5PdzCXa(LxvRx4-#xSWmC*g;$%PX+
z%L<k*){!up+*7>c&l1gBRZoKVOjr`TWxGDpE*<MG?`LjH9Z#>&{PbQu<ALn)6_4hc
z?Y;RrcYD3|pTBau)<${Fy1G5>>ei~grFUy?Z+)}nm4da9`;MKH9_)0vwL(-mcEKc`
znPFUen%EwlzPEU<*+&&6O_iygVomu5IaArhr`T7T=iALxo@2Otk5tXIPr4W9$*yU<
zem*U?hmmzk;tautN|p_`JP+LFVfyvlcXHljBj3rbI*ht=_D`3*<yPd$z~_+X7vXOE
zb@Fci^yjzE#;=>ZWn;*zsMS4h#qLjkn3}u3w&dEsZ%aM?tX|Q($aZ1TLc7yX*1b$l
z6g;8B8KyF4TJq#3<FGSDnXjbYoqPCpL6Q1z&z`BLHTmAzWilxK%U#T{A&$?<)u6g{
zYv0%BJNtM}KHc`DB%o4VcWX!532BFWRf)a+wr8qZ&)<~Ocz2}Bb&je_u2#>wM+G8U
zZ|;aswPZ+Umh!8)nyVdk{mu9Cm-*or-yPM93<-Fx{o>c{)QgpOUoTtjGCS%+!RI?B
z1-s6qcRj2**_l?cDX>H0j$}m2oN3P|Z&Nf|n5YxzmOIZ_Y4;ruhl!s!Bh3@L=6Ogr
z%RDYrD6T$dwld!)=)8>KaY?(R1ue@S9qBk{mponCA<1ZOk$L)(<$+h4b$=h<JyR^>
z#_>-J6i+|rmSDEoF73%OG1AE>a8lQv(red0z1_RzzV9Tp@+Vuabw8VRIpxx}?Oy*G
KY}f4ne-i+;1P1v4

literal 0
HcmV?d00001

diff --git a/tests/data/dior/Images/trainval/000003.jpg b/tests/data/dior/Images/trainval/000003.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..bdef43ad0852a564e5b32010783d1fb00cb11a89
GIT binary patch
literal 1243
zcmex=<NpH&0WUXCHwH#V1_nkTWcYuZ!I^=Bjg6g+m4ls~os*M;i${c)hnt&6Qb?Fz
zL{>^(PF6}rMnOeST|r4lSw=>~TvNxu(8R<<Uft5x!pKI?*u)5A2qPyaCl5D|1TU|I
zk)n*E5y{~H0R}-11_cHMW=16jCP7AKLB{__803NOWMu>c1}I=;VrF4wW9Q)H;sz?%
zD!{<R$jr>d!pzFb!U9xX3zTPI5o8roG<0MW4oqZMDikqloVbuf*=gfJ(V&YTRE(2~
znmD<{#3dx9RMpfqG__1j&CD$<t(;w4-P}Dqy@EqR!@?sXqmoln)6z3Cvx-Yf%gQS%
ztD0L{+uA!iyCzMZGIiSY88c@sTD)ZGvgIpQuG+MD%hqk%ckJAC=<t!F$Bv&kdFs;T
zD_5^wzj5={!$*&wJbm{3#miS8KYjl4_1pI!KYxMz#mK-6@fMJTcnr;7f<S*Uv9K_+
zu!H=?$W#u*%z`YeiiT`Lj)Clng~CckjT|CQ6Blkg$f;}`^g%SK=pvVxipfLOk07ss
zeMX$en#l4Q++zrT-D2QjW&}navmk>#L!0&Lh54U-KJ8?EwC(c~p7YyP%&wlF5$SO3
zjm*Z-pN`8-wsV(!4~lgZUR2q!j{8u+X3prRK@TQK2)Vl)e3F`*#mN$`b>i}2)i*O5
z^BA~}s9n7ilHc*Z(vsbh_nhIZrqFH9-&~V6>(5h~rLWmO<Bma*yo8qV<~eU!<}T-I
zbv4~O`FeKM&pNTG^L8)NxV(IE<}LqKyZ7$3+WUL2{w<g2<vY~AX-LVeEZs4&{$fkL
zo@D=-6U=V@+&jvTarR^dX?sj|&dvL<?8Su5UcwV1H}zh0IDhslLvvTn1#PE^-j%F-
z0vIM)d%Sw#U~xxco#(Cl`pj+YQxBRtt~jl_bnm7uVHZx-ojW+wY_g<c(cywaYm&K)
z>XHvCx>irvl66$&^3CYa_uuVZyY<MbL+=Ey{u3*!D|<C-^Zs>9=Nd^a+@h=L`Jw0O
zp7pbolo>;&{AUQOaBz4cRKTyc`lN}#iPbqD-LpkJcmj{jE+{yDCVB4N^7N++CyXam
zs%?_0pQ|!ma81$HLo@!Ji}YHlocDL_1n;Tm>U;Y4PEfw0vuw-8-nET?Pgh1KwW_7{
zM*Mx6!|+Ptu_Vjpl?;VmMm<aOw|tAs`p+;u_HW=;uSvmscD;OZf9jhrxAV3q-H-5_
zwDWhA)<zGWc@YH*=e)heoZxn_tHHvWk6$8XQl;Lq&D)Jk{8dyI-&%CyU1+prkf29x
z^RhQ@m@O=qTW;RgRGHi3y|ck%v2}Br&dU33mI-HjcUX5EXW-h9d*^&Ei_n&Q=1mgm
zJb{Y}obnXUeF;%WkxBUEa4i3>*X4`<84hgQy|y&!<<hNJw=8*DGQYa?dbIh{Um4S<
Jot6K869ClW|DON=

literal 0
HcmV?d00001

diff --git a/tests/data/dior/Images/trainval/000004.jpg b/tests/data/dior/Images/trainval/000004.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..b68c50fe48748bf7e0fee25c766c8779054c9f43
GIT binary patch
literal 1238
zcmex=<NpH&0WUXCHwH#V1_nkTWcYuZ!I^=Bjg6g+m4ls~os*M;i${c)hnt&6Qb?Fz
zL{>^(PF6}rMnOeST|r4lSw=>~TvNxu(8R<<Uft5x!pKI?*u)5A2qPyaCl5D|1TU|I
zk)n*E5y{~H0R}-11_cHMW=16jCP7AKLB{__803NOWMu>c1}I=;VrF4wW9Q)H;sz?%
zD!{<R$jr>d!pzFb!U9xX3zTPI5o8roG<0MW4oqZMDikqloVbuf*=gfJ(V&YTRE(2~
znmD<{#3dx9RMpfqG__1j&CD$<t(;w4-P}Dqy@EqR!@?sXqmoln)6z3Cvx-Yf%gQS%
ztD0L{+uA!iyCzMZGIiSY88c@sTD)ZGvgIpQuG+MD%hqk%ckJAC=<t!F$Bv&kdFs;T
zD_5^wzj5={!$*&wJbm{3#miS8KYjl4_1pI!KYxMz#mK-6@fMJTcnr;7f<S*Uv9K_+
zu!H=?$W#u*%z`YeiiT`Lj)Clng~CckjT|CQ6Blkg$f;}`^g%SK=pvVxipfLOk07ss
zeMX$en#l4Q++zrT-D2QjW&}navmk>#gU#)irfECoUAm=RBw{$}#kwynb7pQ5S;w`R
z!Fb-@%Em>4(>`(es5hLs>~a3tdkc=;iFeqOw{F;P@WSz|c!bWO2$R+7(;}01Oy&v6
z$(>YlXEpC)l>&nuI#OHKJrR$Zve7*=wNPiB;`Y@1uL(M{{T`Sb=LKG2@H5=Nb9Lpm
z#~N=_%l|VlM}L36^^4o8IUze2yj@hAbG<h9dtKPQ-`w9!SiJd?1MVe7AJ%@KdxLR?
zOl#uSgIWg~Zm94~*!G=Mc8<At!99yfrnlD3EA&0M{bcj}_nZFSa}2U|&9&fv>%M#1
zF^>963LzB}7g|SlCn)t*N;2-0cE2Za=Gw(m>v^h5^0N!xem=wzI{SI*xpzJL%U9;!
zc&;$_rsF;Tx#ro~`LnOD{k>W9o|V_%ulLS>4D-9bef^YQJGaeybNrdN=#}NCIy?d-
z44XI~a;j$uH#qQADobZ;UjA~|sX{+TWpm4BukLbziB4}*f6ibk-Yu^$@nk|>?n%SF
zMz@_=x^->{bY6OWqWHAHswEGa=j7e;ymh4acG>BQ4L9PBm#A!w-s<tBHF=W5#ATPa
zPUed8IGnm|UE$%fM873VPoJ*UUG(;%>E-wDv+vH<S{3(X`mXKo7hk*e?cMtAD|N0J
z&%P+yx45V?KkLHUGjCd_Cpz(4dztGQ8TRWIx$y~AKI`)|&Xtb5)z;E1F|}rbU5;pg
zpV=|nss`~U$%2BjrMyS7rSBN8*~GMC!mdTayQe-(J;A*B3){M=={x5}sTSxJEwHrM
z9<$C{B+0|t&u{|gf!m*%1Dmt&-;OQIepkEg?GKy1a~|`B*Ioa4cl+Y^d*A&2V*mdp
E0JH!D=Kufz

literal 0
HcmV?d00001

diff --git a/tests/data/dior/Images/trainval/000005.jpg b/tests/data/dior/Images/trainval/000005.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..ee802ccd133fdcfba3628eb477e91da774b3bbfc
GIT binary patch
literal 1242
zcmex=<NpH&0WUXCHwH#V1_nkTWcYuZ!I^=Bjg6g+m4ls~os*M;i${c)hnt&6Qb?Fz
zL{>^(PF6}rMnOeST|r4lSw=>~TvNxu(8R<<Uft5x!pKI?*u)5A2qPyaCl5D|1TU|I
zk)n*E5y{~H0R}-11_cHMW=16jCP7AKLB{__803NOWMu>c1}I=;VrF4wW9Q)H;sz?%
zD!{<R$jr>d!pzFb!U9xX3zTPI5o8roG<0MW4oqZMDikqloVbuf*=gfJ(V&YTRE(2~
znmD<{#3dx9RMpfqG__1j&CD$<t(;w4-P}Dqy@EqR!@?sXqmoln)6z3Cvx-Yf%gQS%
ztD0L{+uA!iyCzMZGIiSY88c@sTD)ZGvgIpQuG+MD%hqk%ckJAC=<t!F$Bv&kdFs;T
zD_5^wzj5={!$*&wJbm{3#miS8KYjl4_1pI!KYxMz#mK-6@fMJTcnr;7f<S*Uv9K_+
zu!H=?$W#u*%z`YeiiT`Lj)Clng~CckjT|CQ6Blkg$f;}`^g%SK=pvVxipfLOk07ss
zeMX$en#l4Q++zrT-D2QjW&}navmk>#L()x^S=G1h>7+j^xov-@Sb6H5a}um-9v62U
zYPd5YLRf9SjDTOa=_O|YUJjvSLh;6@ZH~)X)qOq2^iH)_qEUv){Yq*{ljOOZg?5*Y
z?%5++<oS5|lfTs|l0D-3t8SjjRqfMU!nmxZqeb%tPlCZ|ChO#aJC4a6Q>M-desynk
z_F9u$-}cX&8|mv+GUvAcvbnXwuXpd-TwA4V<#A@UbgXa3!U<dVJgvWW>>zjUxwl8&
zCAU4F!1s89N{4&ua*s`iYm~P#J&n=Y?^Kl+6v<?%*uj0^-R-PX>fh>SmzQVOs&3R-
zZF_+&P-;S}c-FQrVF?~D539>0nE$q_oTkZjF8oBmB!h$#Pd#{?nZjA8vwS~iE%mbJ
z<>}JYr{&+{Zrgv}I&bF6V_YY1?#|3L{aLzirCsmsKr!izce-oV)!mfQ6VndS-e#V_
z)Vn5J-Fp9yN@bnBEZ@V9#Tw~e7d)PA<NRi0v{~%Q&d}yk9i~+u&x!W2pIV?CYjbgS
z)1}kgf9~s@yfD@MPRjyIwy@J;uXoR%EfGC2*W@~*Zck9$p2ue<30!iU9kJ8N?~c&H
zP>*xwJnN+^CpTy5zF#)$*4=vd)%6vAo;yC@JH7YIwq4)Kwm<rF>D*?Ua&d97k1=gR
zMxHt!Ckbwfb>`_kRVHR(af|(oUBdMA-*(Revn!M*Kb@3uw`nS)!(qE}p*_Mq%)3?o
z95z&$R(7#_N6TxYww+DSl%IL(9Sb!U?pgKW==Yi()^6{otohVAIVdq<)7`TL7rQsF
zaFGnHOWxU6xVvdboZ0;8mMYxSbeDaJ{uy;TWXr|q+`GNW8Sb-ecfFWgeSgvWr?2||
G-vj^)oBZMc

literal 0
HcmV?d00001

diff --git a/tests/data/dior/Images_test.zip b/tests/data/dior/Images_test.zip
new file mode 100644
index 0000000000000000000000000000000000000000..6a8fd77df479a72123e6c2108e120e4860ae5c4b
GIT binary patch
literal 2511
zcmeH}`BM|t7ROm5M#L(D-~g6Vg6vR)u(xbsEkVK-kUarpl{FG7RM}(^WG_n+#g-_m
z1|i7O0D=KQ*4AJ!MA-u*v`7dL2@kPv`gC6ZfH(8boqNu?Gv9OWZ=d-(*$WDt=KBz=
zEIZG`=C34rP;DdpgORbCamd&>O{c$<B8STL4UC795FcO9!Ik_>sdX3{p;v;rDRcXR
z0Des{6byhs0079Bi0zchp7QIdw{Br>m84=Yn4+T89P6~Q%*sk@XPcjVE#2&V9Np|7
z5Hl;Nx0$Uq90GZI2}bT7>+7@hp-sH(9e|8Z^@$)v6qJ;dPJr`;G@H^2s&lJP4!+sv
z2bhTggaN`q5JdpU3=(AaY~NaH{yGbR6cPlS_d^5(`6C0D-ptPeRHjtAyZZ))hx>Ym
zpFi&vC~gpbuJcfY08~C}NH}@~L{OE;meO^+G;nwA@t=1>#`;gFJhQd>zUorI?5RTM
z+R&A=6`r7)phd}2w-JrTNR}Mdr$_#-|J#!V7YCIeTxLj@!}}F~K`uy?xV}(th+xWM
zyo*54a>Iz--125gbss|9s|^WN_Xuhya<!Fdl)y5K+a4GXBtxr=;~5(zb(BVWTjJ{5
zdt@lqG>JF6P?wK0P1)IHa`SPd?|1<Szo0b!dfq9a-JGoS^zwAsc}+-7%xwWPNjEDC
zJ$dqXTYcvKiuWL5C-GUwz;g30dSbg@R=C6!*gN#k-(9i3P3bmO7zz9yu_MaTP9sHX
z|DmNLppXy0-Gh}!z5q>Mvj-bmaw=)d6dgV6{N~siF;{ew$$-+2Krjw|v=$5Z=FWOo
z^R3*QCDUuEmsMt_-%V+N_2tHNV-}P>14~?tmPTlfO_Ovhqhl%ORKS62C-2`Lwhf}G
zJyz>iHlwK2sL#=KInuyvu3S~Ii5oV!sGZSm^`Nk>F&Gp<Yu%q=vtKoBDS}OWliir@
ztTHc7j%E~xW1@PEx<^>4_d0v@I2k>q^bNGq$IqA1txFm!#Q5j^80I;lnhz7p_c1Z`
zVi>!IOq&#Vi#Gw}X5s8xnDmsIhri35iBe!J#{;$ZeLO;G#I~oLZ5Uku(9zl2(!2+r
zzN(S)gyBtbIbSFRQbxBY-h-d$h><4Isb}1W%s~s8P1Be?W7O*EdPz0#+a{a-MM?&<
zoy249_B(289HB>|&`~Il7^;10BR<)5s4Boxhr<yesfv0M47L&+)KG?*sVfB~P|j;H
zzfpfJ!X`ZWeK9_!MtO*Nr_#DHYU#{!7o)?zD!QUupvN{?49$lB67CY>B_|#05!s^4
zF^}+dR7_w@9zW(WH{9<iL)?kA=-s$^tzaf-w1E<NZ9k62PJVA$Kn@GA<CJxgw!mxL
z(c01*!FYOj%+CF`7fICl`lH@VD^>Uttccc<tg$poNuRYa43~_NI00gqb_O~bW#Ku4
zwR)wAxuVKNUvc52uEZ{?e_`y*WJ_j*qgTdb<#UKwp4t|NhOy1)Q1W@XzK6mFPe1xC
zJEhD~O&s<}e1Y_CWjW2Zz%`LSBUS?~ArwWS$8%^z0vFeqa@Cur`=qlYfk!2lfsww+
z&infyzE9C|PRJc*dVrOe|AZFp|D)x95-qV7u-dT~3W@x}VR|7XTcCktA#ZJ@aPjEu
zy4=qL;YK*;(=9>NG^5O9>vRrP?YO6(8aJtZWF;8->o(Mu9$FgVO%o?xTO_{L$uu|C
zW9Ciqu;ohh-9bdgvj<H}J6I3=LtW>cm>YZQ@^ce&ljR8PjEUUW`rIsEZ>pew8Ck{1
zeu(!P%_i0oLZ8<)*X6Ki?Q9e^$~%dso;^*3l)jGKZ(y{RY1=p~^<IdN&&c?qXH++d
zCbxC|>rRJt!mkC!9Jj5a>`d|XtMz|+N)ql6!(1n=JCex9%GIl>7uHGTQ?lBs6Da5#
zz#j8eJ<w{rLl1hT*&b<2)N-$gYr*SJTm(_(Z#LV#ZxkD!ghgtZq~Hs_-IKOJPl~aL
z6-}+3yyVrW!7|DdnIhb7<PLjx<K0B%IFzNC^-b3!QUFE@Z=P!LQ%E1q!rA~K>w-pA
z)zz-Rdy;ffmtl&dUbL?K$Wez-?=wj^2QOy=Q;$%9dE(?L!M3N)>sS+GgB0ZB=r#3@
zb6u6Nr3Xf`lNSSv!A{%Fe(^WXcPvxmdVt7i9P@gf9T68TW3apV%mGZQ7S4CAFm96x
z0Jd)Lw3qpepmt_C_Iv1vVsfpCFZPF5&V*I;%Hot}OVUhsL-e+kk=5F`dQRr?_Sl)L
zn~VmahTf_0uB9M09zOHqLYua=C$5E?&>Y4a4mTU|?8W8kv1h<IH!L^ihQ-Le_?Dbx
z5~h{w{C1K9b6k!nx=?i`s7EO3rMO-l8nGWzuiq_ox(kip?P;}<9};H?=ObriUB+#)
zlehe4^Msfs6`)ZN+tF)}{X6kt7>W%x9=Xr^&8TY=wgW8zb0X<KxPBxKzrbn1e>OfJ
zJ<u0?OtTN&r#9%{lmFcaeVpXu`}w-cXOn;1A}9M#cYIE~zjve`Fz`QrKiqN1KPP)(
Rzz3b+!RbAy9FY&Ne*tRJnM?ox

literal 0
HcmV?d00001

diff --git a/tests/data/dior/Images_trainval.zip b/tests/data/dior/Images_trainval.zip
new file mode 100644
index 0000000000000000000000000000000000000000..9a125e5b2ff8ec8698aa77203c0672e44818fd64
GIT binary patch
literal 7440
zcmeI1X;f3!+JMypYNc3l9-vi583lwO1gKU)##j+3Lzo0&WC-&VhJ{5G5l~XXl%WVh
znddQtL4hzOQKk?=0tf^MBvC>VAp+NW@3&l^_qPALR?k`IoPE}M_p|n|XYcoYZ&-dM
zc4XHd7bn@m>C@mpuWvto&HX(f-XWTy!5+|na1TGt8~=&k_bGZHHUn)ewrkhK$LG}l
zh`#XY(zqK45yj8#d?m4469588n3_sRn11i|K0dE2C*haWRCH?QFK9Fxf%qlGEHUdr
zUY^;_>)CEs?JZnw>@7@9FJA+JFPob=nwq|Ju_biA>h8YkN*^A7(Pv7Y=-%hGPfkfm
z=^!9oOtUKS>9fbr4)xFM?3TDJB_S>$?qjMTp?KNU=W_3k*@^iCj+eLCR}#wZUY<T4
z-nSQL=HE!DOsI5rcJ~bpb-x%I7<jSg*9!3go$7tHU!Ol^P`iJxVy)`YM<;Y`T>A1?
z>)-u$=T*-^m0t5})+iUxH_{n5OYgEy<vJ-A`7n<m?MWJy0UTM3YuDL)kJ&>{f9gM9
z0$o0t<JhC{+<W0@rX5ke!k;aJ1|t+fIR^flk8|pdsk_#OQrC{EI`~hvd9O6G4Z}GG
zq3`=%-zI=iz_8`D%rZ*lbaT|oYykm;F@|ryStv`#8pm&JvPJ3Gjvux?z1)2gcb9KV
zi*2SP-@l)8UuIs@v?%z=p3BGVul=ZZmhgk1`-+D`fvMD?;^YGW+4);~Qk&oB-U@wc
zY1K2I&oX;L=`@xj-M04HkmP73b_8g>y`Zy4F5U4-7bc$v&8kE%3DgaX=waCYx*!O)
zxFEF%6n(k?K2)D5&Q%L0x8;Vj#vl$D=yyW-maIz_#eR~dgGMK!o+;j6M0<12Epwo!
zfK%m4zjQ<u_Et{yp^e%7+qi>z%6037R#Ne}ddKQmUr|X~1W&E<r2obG^-$)lNA!~n
zh}>N|_;<*Z&X}mD4P3Pn7n^#3W~i!W<vUV{M_~OKBE!wLo!MIYVSTi#I1Vx<GwBc}
z|J?cd%uwz^jI^q>JpH|XWWbp$RPi`pxfwXZdUd-9H;@i$vO1ug_x)0o@5YN;FA36B
zil%5aq|vV%j?2h_mr5qZEmyyOJI~5I5JbjSY(TqI<*c)OC?%dCrQV!rJM662`o$|h
zMBY4Pd2I;i{5tA5sNB*n=Vr!9d<A@G)U8K=lc^eQi_Qz<jt_3W1Tl>((eQJcoUsbX
z`0UYXc_OzN1?+cyuk+%HuDtL@tJDL5P5Mhk6N)+-tY@neTP4MF%>QPYAgjK*DWBh|
zy)hq@Bun}*)c~8u<``FnHdGClqHXmYOtm>8W%jZ6QKS$1pAA|0l8Q<=s0d*~f(<2U
zy#0jbec)iW3%^JFLEhs>0q}}({Vo0RyZvr;JCe+@tF^j<0n#@4mHiffSg1@_e@(%a
zrUy*=5rd!P^?0XI3eC-mea(}yjf_s*D4EdczYt`3i*<(g!Vb3RP=Ru(eUdy9&#Wt|
zZOfQ3Q8}|E$x7l(0>J+1;q0XlY4Ew`@2ky&SsyZ?!l|w7)aXPhQ}ElPEAV2a<2BVn
zWRI>e+XT0D<*xm&$u*$BP|tn3#0+CQEL(;Tr;6ZJu^j;>S~O2wcg>0>7f#!%AjN6F
z+p*sD|E+UMt{}whqj4C2WgV@5tn;_Dj%x5=N(0x)xD-Pz&vXuro|~(0eUeHLQ}TlY
zg`GU_Gj*6s{30Vx53fa<GY=nzA=iZ)E+&rKA0W!-J-$VCQVA6s;Tz;@*kd415&QSw
z@5;kTvw@y88p5zK88T?)lo9GqsmHcx0F^e{{BT*#`|jI#7($K*I?bAI@{|-x7x!R|
z^1?;rrr42!jzs))eb;(n>(+Lg$Wq8M2KVzEy+z?Q&@9h0dQ$;J0mb;R+BOH5jl^D0
zr|ty+^hk#{`K2&M38~e)=EKM>;U$u))CFXe4Qiy<HPZD>%hl0)P#<gn-R~xK+KZ*N
zRfq#C9{e#f<Msro_xn0bm_*v6LBOio5p(I4*bb{_JEN&186L%$hZqx&B8Tx#bsjXi
zFJ&xfvl76oYOmC#MTA5B!`@DgaMN;`xvP2MO~DPD3_1&%1%TvnpmWy48jVJ^on78@
zaJ=?6nfA%3gD%>VDpfynt~~^6)0t5#Ts5;YwvJD84QHQzGc=+P@q#`6O>wK9Jct+(
zULRe{y4tCpZcIJjiv%)rP14`tRWAUQTAM*|LKXrPu`W1*8t>30*9NX3?DmlSiXBH#
z9AG2xL&9sK`%Tc&dVf{~ep32G7GHI)@Amd%r4eQ&Inxl_3N#qszMC-tzzml8w1bEI
z%Wr(^Ll}cs8|G&YuAx9b661(tOoSrWv+QSmUSDCsIh~vd#4S#s?ispXf(~T3WDnsh
z)nE#<Mx(XCr!_x|Bd%^<6jq}XePpHB6w)mV-REBq>@-Mintug=zvLI+wsCTl2vbRs
zwPG0nlev<EY+HoV(T7O`W0`Gk_%O<rl5LZlz@(twbuvOYJj~5m-oTbIrg!2Gf1#f&
z)%C1vAJsGUSNhTZM?Zf@{dlmRI|m#V$b#R5Mj(X))!n8GQ<%&Mkak=%JqKPtYi{9C
zMH1sUl|=~aVjxTsfB5y+_Qt$>#98xb1feT?YRof>i=lq7SlWI!{~{UXEpB;y<@yP0
z&UwZ=NHVjcRH+NDsFqBx1!JLEX<=DHou=n$#SVAkqN_0Peh|EWWEMgcFk;X+ysL=p
z)&lk|X!8NnG2vmpV~k;(Zc|e`b<Lv7sV|m5GCvsJI^}e>^bF2jnmlx&(#YB`-DcXk
zjj~$sD5Gd#)TX8=<`-0n-y7RiRU(h=qe9klX*VlnPAbt;cwUr?t|nL{?PZ^VLQs<X
zj|ziH&X~OcybD{=9K%bn+Na!kdl^&uB~h^@BUp9KYbK<RmlD{tWf0XAzsYlk%u$H+
zTCI7zQ5L4jQ&?<bMFhJ!2eYS}p3BDDS1p0PaMgG6>B~whu8K-uV_wZl+UDq}M+GB-
zCUTw)Io#xujAC%VUEgYgkVi*yW4No@Cy(qbX!uNgOIV!0dxPHEz+K^?V}VN80QgPm
z8zq&v203<O{Y!jlw`)92$F5=#HUMoi99}Rm8&hy7gU}219I60BbQe2m%j;NfjJXiU
z(ptBf@QuL_Z&SEwtZPYPZR2t8R>E051GuWJitrp6e*O$k25}Dz8OF(uqgJiTCXP&;
z4KmX{=S`|#L^PexRks@5A3BJJl-G;W9=z-Zp`J36!8~ALp116Al_L&V9p@a_;ZWD!
zx6Os%;d@B$^t4b^oh3$t{lu%jsSg<2zt*WrZ0$(rV$LIj=H3^JKPtwCSYDv{WeL1;
zPAq#J(J%1@EjO%S860}>bVP>J211?EiY2z9f}ynVsvXHjU%^ht{x9TXkwS03`cXWz
zzmkv6Kl1rI$|s)~&42NMY>W-BHJ%h~>?d!qReT)C<cFd90#l#cOCZ96BCW-;eQ%G!
z*P5lPKNDh=-E|=ABfsrEET1?9mNGUc65n|3rx*lnRI~C<rbbD+n2lC4_V;rm-Jtye
z{cuvCz3r0TBCOIpkH2`HI85=w1`&R{?s{b~l80(i3&{#;Xw3~k#~9&Q5cI@o6z(|G
z#kF0ZhukTp!-Y=lExf}H(sF%G=I->xLN9wHC;R94n&+;d+MS{OK7e?R%mP6lUVE?J
zNYQYS8T+%q^M#M*?Ea^D(V7M*6H#V<OBwTC<H%L6#kkRKNkqAkD?YHgS+0h}8;^};
z>Iq8rTFW?~?7^)OBgpCl#VnEx3aaOLvt}u<D_^(Y#Wbvc?@@4>l3%|;Y4C>6`l5&{
zsH8`Gjpaw&bJ$7F9LvP#Hbm{TJ`YKiKOXRUZ2iM4UMP9f(PH57S=()$L_2+b;31V6
z2j|$~t25m!R62)xP8OIz@Hu|uj0plL42asaO*-6*P#M!RA0yl4XfzkyS;;@SL%J4S
zaf>9vh2Im7hVYHH;7ZDFuN@n`Z*wPmJBn2c5Kd#m(Q@0yM2|>?cRy!%^DL6CXcl0e
zZ#cL2cyB?nWkrC%GD_i$5zf`P#e`4HqD9dV9JBY<lN*K>z6E>9Z4d9=4`DDoZ2}D^
z#@s!K1kI<~B{yMICfihTTSX-Wrf%>~<Km?D^;ZRrQPe!Z&@tqoIsoQdI>dg*pw84x
zv|h4?ENtlwCf4B%%MH_X0{#2&A;wwP?pPZ06q7?So!7)|q8=@_Cn^{A$;SliBjYJ6
zYdt%XdmGuV&Zqdn%j0FvNT7O-8#vl%GG@8z@$v|1;J@9IiMW2z<fC`S|H?fV|8dXX
z(LG&Ef#pcO3{QhTtRbz1TKA+MM_$qaB$v-k4!HwiFz>l@T~KUu%;;&7i$H&86)#TU
zbQ`YrI|Eh$k+YHZz$=S468rD+p-=k_6?uvC^ERa|b-58W771NaG9~IOn1^Q8)Fn)g
z)9-aQLGZiV6frb4?%+@=Z%@^Q_a_5pT3Ul?w^N%+7Isc%7j$$?Z}#|)p`M@*Ff>Yu
zEv~0Uc#TyCj000tW5o3D7G^v<=-WZYcj^CFq#Lwyx#FvD0JkC){Y0emh6I<k8BCA-
zi1P~b=%(ycTy500$U2^TNrKwSbb8wnHf_W{VYa1k|H-4|0~K<(!@q8-D4dM2z)d6c
zL)dRh_&_^_4XQZI<hwWf&|5(M6b`espc(=LI%LB~-eGoJc&n=)s1(XJqdbZ{u)?Ll
z7fq5jz|-w<1661m6Mt!Y$a#HW%~nQsw{(&<>foiZy2R6GB2_Y<*Xe4;x2)XC#}?GK
zc-J{Zv~*rAZYnW>TsX=_QnDho^EHHpv#td+k{aCrAZDP6H~uNc$$cziFEL~-Ac|oy
z49Bg8_9UGSB3RyPG==dahjW4b9&c&~os~kaMV+ysH&(t4bbL0Q@w^yBVQECeU$3u;
zgwzO#Z^a|Hb}U68OsS%83IetSnFf@{5Vs?2XP40&Y?uc-2T(C`82!EiKg545DGE!O
zdY`C*<wu=bv@m1b^@Sp{opic1%r174SF`=?eu+eQUGAdZWXMs6BOX)yJSVk0DCcJB
zw%-+D+!-J4`-4Z<(IEx54y->q_Op{;y5pjH#=Hj`qMyL)WRr&yh*Tkrfb{MtqYDHN
zh>T0=8!uKWciM2V??iZ5Tzt)c=Ud3UD(K~p%9;Et?dblaoxh`Y&Mp@Xl(U?Lp~KkB
zsYVmqav+~{X}`U0dWxZx?o`gVXUp~6OgpP+>lt;sG#|Xu%8#5I(IYIBv)W~EM;AM(
zzE*xYAE(ezXudW@yn?ed6RsXoUyA{5^-r^o^vecq*#XG&r2?pihs*fz>t`GHl)7dv
zBEo{ZWC-(V=WQ3oI$E0y;1&H9Fwr70b)B!06GDrpPC3m|a1s8M6*n8#^y{1q#+z=>
zCRV^P<8FrGPYi`qG&ybt4Fj5i11~>+X%yB%D0-<o;GBc$y~B<u9XRmFtM=CFjPYAe
z`1pA~EUa#DP{-E}z$$OVcOFyL&9?*k(z2?>(z70nc}ow)JKNce%o`k!JLjHp`9*TE
zERbY1TR!60j;%vRQ+aElP}ayAH>ini0z(5r7PKl6fCvaPcUz6#G+ZeR|1CST*O0Ee
z!U`BzN`^kT1JePyv%rTd1Mu-?&udApNUjILGc~m8fGoK&D6URxQcd6mxf4<%HBy?s
zcvUn3QooVb(4vo99)@yEgnS#<Y*t*ccY=cR1hj^NTO=bNVzPaM(LXgQDF=|}bP!@1
zEyT2m<@pG+CHLP6mqIZ7;Y>tcUFfuCUf4<iUc}n`+Jr2F<)RrPZ(1eHoA%vSOK3oy
zbxU*e1R-1RtQ-iPjt~R%81U9HDu?T;n|tDVH9Vp>VK_(v_2>WsYctSHyO{ZUwi?{>
zN_JM3Nmq%NI$dg|ikrX}EHwN?BNagg$UuJD{Zj{o<(q-)aH5oNlhAfNhJ`xwYj*WA
zhk7rCp6AefJ!xElyQ(@xua_hFZHHPO<v?2p+pq3CHjt@Z@C@b98S|1t$3~p1Rb_j}
z($<K>)(&jX$6Raoo+DrVc{l9ejj?Zcu`mBI`tRP@|IPm2-LZeq-nFYRLF0eS{@g43
zyo!HwzN~kD<`jNZ;+L!V#Q9YH{*v=$;p#I-ZvUTfK9#Y)<b0Wfe&+o4&7W{SWu#wn
yzC2HU=A4oK6V9j8<(Hf<H;B(1#IZl&eA+H<Sc*&h5xe)}&Dp(cm*nX`{{96CS4waI

literal 0
HcmV?d00001

diff --git a/tests/data/dior/data.py b/tests/data/dior/data.py
new file mode 100644
index 00000000000..a428a41c7e3
--- /dev/null
+++ b/tests/data/dior/data.py
@@ -0,0 +1,171 @@
+#!/usr/bin/env python3
+
+# Copyright (c) Microsoft Corporation. All rights reserved.
+# Licensed under the MIT License.
+
+import hashlib
+import os
+import shutil
+import xml.etree.ElementTree as ET
+import pandas as pd
+import numpy as np
+from PIL import Image
+from pathlib import Path
+
+# Constants
+SIZE = 32  # DIOR uses 800x800 but smaller for tests
+CLASSES = [
+    'airplane',
+    'airport',
+    'baseballfield',
+    'basketballcourt',
+    'bridge',
+    'chimney',
+    'dam',
+    'expresswayservicearea',
+    'expresswaytollstation',
+    'golffield',
+    'groundtrackfield',
+    'harbor',
+    'overpass',
+    'ship',
+    'stadium',
+    'storagetank',
+    'tenniscourt',
+    'trainstation',
+    'vehicle',
+    'windmill',
+]
+
+np.random.seed(0)
+
+
+def create_image(path: str) -> None:
+    """Create random RGB image."""
+    img = np.random.randint(0, 255, (SIZE, SIZE, 3), dtype=np.uint8)
+    Image.fromarray(img).save(path)
+
+
+def create_annotation(path: str, image_name: str) -> None:
+    """Create PASCAL VOC annotation file."""
+    root = ET.Element('annotation')
+
+    ET.SubElement(root, 'filename').text = image_name
+
+    size = ET.SubElement(root, 'size')
+    ET.SubElement(size, 'width').text = str(SIZE)
+    ET.SubElement(size, 'height').text = str(SIZE)
+    ET.SubElement(size, 'depth').text = '3'
+
+    # Add 1-3 random objects
+    for _ in range(np.random.randint(1, 4)):
+        obj = ET.SubElement(root, 'object')
+        ET.SubElement(obj, 'name').text = np.random.choice(CLASSES)
+
+        # Create random box coordinates
+        x1 = np.random.randint(0, SIZE // 2)
+        y1 = np.random.randint(0, SIZE // 2)
+        x2 = np.random.randint(x1 + SIZE // 4, SIZE)
+        y2 = np.random.randint(y1 + SIZE // 4, SIZE)
+
+        bbox = ET.SubElement(obj, 'bndbox')
+        ET.SubElement(bbox, 'xmin').text = str(x1)
+        ET.SubElement(bbox, 'ymin').text = str(y1)
+        ET.SubElement(bbox, 'xmax').text = str(x2)
+        ET.SubElement(bbox, 'ymax').text = str(y2)
+
+    tree = ET.ElementTree(root)
+    tree.write(path)
+
+
+def create_dataset():
+    """Create dummy DIOR dataset."""
+    root = os.getcwd()
+
+    img_dir = os.path.join(root, 'Images')
+    ann_dir = os.path.join(root, 'Annotations')
+
+    if os.path.exists(img_dir):
+        shutil.rmtree(img_dir)
+    if os.path.exists(ann_dir):
+        shutil.rmtree(ann_dir)
+
+    # Create directories
+    os.makedirs(img_dir, exist_ok=True)
+    os.makedirs(ann_dir, exist_ok=True)
+
+    for split in ['trainval', 'test']:
+        os.makedirs(os.path.join(img_dir, split), exist_ok=True)
+        if split == 'trainval':
+            os.makedirs(os.path.join(ann_dir, split), exist_ok=True)
+
+    samples = []
+
+    # Create trainval data
+    for idx in range(6):
+        img_name = f'{idx:06d}.jpg'
+        ann_name = f'{idx:06d}.xml'
+
+        # Create files
+        create_image(os.path.join(root, 'Images', 'trainval', img_name))
+        create_annotation(
+            os.path.join(root, 'Annotations', 'trainval', ann_name), img_name
+        )
+
+        # Add to samples
+        split = 'train' if idx < 4 else 'val'
+        samples.append(
+            {
+                'image_path': os.path.join('Images', 'trainval', img_name),
+                'label_path': os.path.join('Annotations', 'trainval', ann_name),
+                'split': split,
+            }
+        )
+
+    # Create test data (2 samples)
+    for idx in range(2):
+        img_name = f'{idx:06d}.jpg'
+        create_image(os.path.join(root, 'Images', 'test', img_name))
+        samples.append(
+            {
+                'image_path': os.path.join('Images', 'test', img_name),
+                'label_path': None,  # No annotations for test
+                'split': 'test',
+            }
+        )
+
+    df = pd.DataFrame(samples)
+    df.to_parquet(os.path.join('sample_df.parquet'))
+
+    for dirname in ['Images', 'Annotations']:
+        archive_name = f'{dirname}_trainval.zip'
+        archive_path = os.path.join(root, archive_name)
+
+        shutil.make_archive(
+            archive_path.split('.')[0],
+            'zip',
+            os.path.join(root, dirname, '..'),
+            os.path.join(dirname, 'trainval'),
+        )
+
+        with open(archive_path, 'rb') as archive_file:
+            md5 = hashlib.md5(archive_file.read()).hexdigest()
+        print(f'{archive_name}: {md5}')
+
+    archive_name = 'Images_test.zip'
+    archive_path = os.path.join(root, archive_name)
+
+    shutil.make_archive(
+        archive_path.split('.')[0],
+        'zip',
+        os.path.join(root, 'Images', '..'),
+        os.path.join('Images', 'test'),
+    )
+
+    with open(archive_path, 'rb') as archive_file:
+        md5 = hashlib.md5(archive_file.read()).hexdigest()
+    print(f'{archive_name}: {md5}')
+
+
+if __name__ == '__main__':
+    create_dataset()
diff --git a/tests/data/dior/sample_df.parquet b/tests/data/dior/sample_df.parquet
new file mode 100644
index 0000000000000000000000000000000000000000..1f99eba0378bf72ebd94a32030b8628059f52392
GIT binary patch
literal 3186
zcmc&%J8#=o6uy!yHE}!$MJPyylNf9xWN>6r4<`yz6qFLlRAt9eVo_3C7<`$cOj3+U
zy%KooP-N&2=+L1BTA*Wxju|=>os0a24nfhOL#IqVht$(HTA(o+!o0lqoO{3X-SdLH
z$5t6?iTX7_edViAVT!y<$SdF8Dj|e31XZy&ovxsneL>$$27N1uwxx<!31PZd$x<p|
z-X$arQ<A|U>$^%KSAM*p*v^$7s;eZ-;C6~o5o&b<u)|b{3axFC8>^?FlkjA5cQi85
z0m>$dlSz~VpG!CVFou1B!1G^T$N%)NQ7f@5358?PWeuqwSc21{{E=|v%V6Y{KmM~X
ze&N4bi*0~Y2<0a*gyBO7tiKIVpMjHBTqnKs$=5*4nr6ol9Ia!X^wiMM`|p9LK8GQN
zLmGz+4B>17l&Ac%bmQ9DXy^m?Nc0~zBoTA!rND>iC4c<IJ9A#r1yRvwUV0vk{O*tc
z6^y@JTH87g<7YZ8No6V!cg(BkCqW?S=2HMBkW)*zhCqWaE>qEk90`Crx`ayDv;4jn
zdVhd?7yoT}cBi0i>6+sP{cB(3dtdyE<@k$>81=dHXYq<vvLqU^rIum{RESV3*ZuQp
zbe&Yzz^*5r`E6e8nI20b;n-U2?*E>YZ#%x{5sS!Amm=Z#g~;pBWkO;b(U2vWvS3HQ
z2|lAWQ&xrtQb+F@rcK{j|M(ew1TvV>UBOfpdSjh71w#RW+0%7c*^bb4V3~C19Sf$n
z-Km08=J-=scz6dcxH5)aL^;$HT|QWpd9)6kk%i{yo~cP4*<;W%tkG1_5!;I7ATvX8
z1X*wd*#3-GOxUiODxTecT)cUkKAt19$bz2rGsIb7b3*q<tk7r28$fP+Q+k%^r|mB4
z&eyJ6#ivb9#cyuSjeA!SoKDvbhpvfTp*zB8SR<j^?F`U-U+LP=%2CSPN+c6W8r(yV
zt<Nb_iBuv@ACu?`Tdh9e?|6MA`p3mhe74kkEXzKG7oU$<HpAvsw#c$7TToqDKEI$J
zpz!`wzpEC!HH<EbtLIpDz`{BBB1mC?A6SEh`>;QMi!=0IvsBB}Q@ed}yXJ`Ij`l#y
zi^{0n75MBC*Y2pCS#F7jtaI8x<&11g<o9t;Pv(bqrNC-Zy4sS=hah7I<8@yua9i9x
z)#eK2r*f$_K%AXABcr~N%Gol{^y(?kcC$XU*=z8Oj(bJ3W{U;1*R-1a@Ti_T!)~bv
z+>1}^>1tLgAtzRo`K$%_N6kkZ+6IoyK&j=DN<Hu5az;)Qj9ObRxO%5queJaq*?0te
zw{5M-XWL?`YKeyA;?-)^QsuF#9iHGWjbMM#0sl>Sv6{d$t!AorC;^_};Tr;9vzx`-
z^j_d^r@_m5J)LjKB~^3%b>8<VWf`$F%vA~)-x)u#RD}Bt|ApVM)i7%I+u$dq^R`fb
z==!8-=(<>{9*RcMfmm)~9!aI4HICb$0lC?z?;gtA`e3YQL_^2eP4bix>-p?_ZiuP!
zlP15L^zxX|<x&was;z0hZIAOaUDiR~mozUY#FDN_MscKgJO&D197#ql?c$hCT{3qq
zF_m%iW#_Tf+bLuQoSDS@oAESiBPpf#MZ_#{qe`3W?TpGfEJdhumfg-njX@n@+2Xqm
zuQwal>r-eFw?TBj2t_|Wg!Mmp_EG5h2u0;Kc9ne`P?4{qkd<(7>mMg>pJCaBya3^F
z4-O4kY(CI88f<>R?%-xHHtA0jJhwBQ#9OEXI0yR4(GN&;-4eP_dWv&XvaFkK6I~xS
X$#t)N#_qzeDDRIr7YW&e|2F;xL{p2J

literal 0
HcmV?d00001

diff --git a/tests/datasets/test_dior.py b/tests/datasets/test_dior.py
new file mode 100644
index 00000000000..5463da333e1
--- /dev/null
+++ b/tests/datasets/test_dior.py
@@ -0,0 +1,107 @@
+# Copyright (c) Microsoft Corporation. All rights reserved.
+# Licensed under the MIT License.
+
+import os
+import shutil
+from pathlib import Path
+
+import matplotlib.pyplot as plt
+import pytest
+import torch
+import torch.nn as nn
+from _pytest.fixtures import SubRequest
+from pytest import MonkeyPatch
+
+from torchgeo.datasets import DatasetNotFoundError, DIOR
+
+
+class TestDIOR:
+    @pytest.fixture(params=['train', 'val', 'test'])
+    def dataset(
+        self, monkeypatch: MonkeyPatch, tmp_path: Path, request: SubRequest
+    ) -> DIOR:
+        url = os.path.join('tests', 'data', 'dior', '{}')
+        monkeypatch.setattr(DIOR, 'url', url)
+
+        files = {
+            'trainval': {
+                'images': {
+                    'filename': 'Images_trainval.zip',
+                    'md5': '17b9a13f7f9e30bc04f9d70b4bb0a47b',
+                },
+                'labels': {
+                    'filename': 'Annotations_trainval.zip',
+                    'md5': '887a590a2872be81f00f21f502a7cb56',
+                },
+            },
+            'test': {
+                'images': {
+                    'filename': 'Images_test.zip',
+                    'md5': 'e14666a09788bfb0d5ad39a82f7da946',
+                }
+            },
+        }
+        monkeypatch.setattr(DIOR, 'files', files)
+        root = tmp_path
+        split = request.param
+        transforms = nn.Identity()
+        return DIOR(
+            root=root, split=split, transforms=transforms, download=True, checksum=True
+        )
+
+    def test_already_downloaded(self, dataset: DIOR) -> None:
+        DIOR(root=dataset.root, download=True)
+
+    def test_not_yet_extracted(self, tmp_path: Path) -> None:
+        files = [
+            'Images_trainval.zip',
+            'Annotations_trainval.zip',
+            'Images_test.zip',
+            'sample_df.parquet',
+        ]
+        for path in files:
+            shutil.copyfile(
+                os.path.join('tests', 'data', 'dior', path),
+                os.path.join(str(tmp_path), path),
+            )
+
+        DIOR(root=tmp_path)
+
+    def test_getitem(self, dataset: DIOR) -> None:
+        x = dataset[0]
+        assert isinstance(x, dict)
+        assert x['image'].shape[0] == 3
+        assert x['image'].ndim == 3
+        assert isinstance(x['image'], torch.Tensor)
+        if dataset.split != 'test':
+            assert isinstance(x['labels'], torch.Tensor)
+            assert isinstance(x['boxes'], torch.Tensor)
+
+    def test_len(self, dataset: DIOR) -> None:
+        if dataset.split == 'train':
+            assert len(dataset) == 4
+        else:
+            assert len(dataset) == 2
+
+    def test_corrupted(self, tmp_path: Path) -> None:
+        with open(os.path.join(tmp_path, 'Images_trainval.zip'), 'w') as f:
+            f.write('bad')
+        with pytest.raises(RuntimeError, match='Dataset found, but corrupted.'):
+            DIOR(root=tmp_path, checksum=True)
+
+    def test_not_found(self, tmp_path: Path) -> None:
+        with pytest.raises(DatasetNotFoundError, match='Dataset not found'):
+            DIOR(tmp_path)
+
+    def test_plot(self, dataset: DIOR) -> None:
+        if dataset.split != 'test':
+            x = dataset[0].copy()
+            dataset.plot(x, suptitle='Test')
+            plt.close()
+
+    def test_plot_prediction(self, dataset: DIOR) -> None:
+        if dataset.split != 'test':
+            x = dataset[0].copy()
+            x['prediction_boxes'] = x['boxes'].clone()
+            dataset.plot(x, suptitle='Prediction')
+            plt.close()
diff --git a/torchgeo/datasets/dior.py b/torchgeo/datasets/dior.py
new file mode 100644
index 00000000000..07af4e8e8cc
--- /dev/null
+++ b/torchgeo/datasets/dior.py
@@ -0,0 +1,393 @@
+# Copyright (c) Microsoft Corporation. All rights reserved.
+# Licensed under the MIT License.
+
+"""DIOR dataset."""
+
+import glob
+import os
+from collections.abc import Callable
+from typing import Any
+from xml.etree import ElementTree
+
+import matplotlib.patches as patches
+import matplotlib.pyplot as plt
+import numpy as np
+import torch
+from matplotlib.figure import Figure
+from PIL import Image
+from torch import Tensor
+import pandas as pd
+
+from .errors import DatasetNotFoundError
+from .geo import NonGeoDataset
+from .utils import (
+    Path,
+    check_integrity,
+    download_and_extract_archive,
+    extract_archive,
+    download_url,
+)
+
+
+def parse_pascal_voc(path: Path) -> dict[str, Any]:
+    """Read a PASCAL VOC annotation file.
+
+    Args:
+        path: path to xml file
+
+    Returns:
+        dict of image filename, bounding box coords, and class labels
+    """
+    et = ElementTree.parse(path)
+    element = et.getroot()
+    filename = element.find('filename').text  # type: ignore[union-attr]
+    labels, bboxes = [], []
+
+    for obj in element.findall('object'):
+        bndbox = obj.find('bndbox')
+        bbox = [
+            int(bndbox.find('xmin').text),  # type: ignore[union-attr, arg-type]
+            int(bndbox.find('ymin').text),  # type: ignore[union-attr, arg-type]
+            int(bndbox.find('xmax').text),  # type: ignore[union-attr, arg-type]
+            int(bndbox.find('ymax').text),  # type: ignore[union-attr, arg-type]
+        ]
+        label = obj.find('name').text
+        bboxes.append(bbox)
+        labels.append(label)
+
+    return dict(filename=filename, bboxes=bboxes, labels=labels)
+
+
+class DIOR(NonGeoDataset):
+    """DIOR dataset.
+
+    `DIOR <https://arxiv.org/abs/1909.00133>`_ dataset contains horizontal bounding box
+    annotations of Google Earth Aerial RGB imagery. The test split does not contain bounding
+    box annotations and labels
+
+    Dataset features:
+
+    * 20 classes
+    * 192,472 manually annotated bounding box instances
+
+    Dataset format:
+
+    * Images are three channel .jpg files.
+    * Annotations are in `Pascal VOC XML format
+      <https://roboflow.com/formats/pascal-voc-xml>`_
+
+
+    Classes:
+
+    0. Airplane
+    1. Airport
+    2. Baseball Field
+    3. Basketball Court
+    4. Bridge
+    5. Chimney
+    6. Dam
+    7. Expressway Service Area
+    8. Expressway Toll Station
+    9. Golf Field
+    10. Ground Track Field
+    11. Harbor
+    12. Overpass
+    13. Ship
+    14. Stadium
+    15. Storage Tank
+    16. Tennis Court
+    17. Train Station
+    18. Vehicle
+    19. Windmill
+
+
+    If you use this dataset in your research, please cite the following paper:
+
+    * https://arxiv.org/abs/1909.00133
+
+
+    .. versionadded:: 0.7
+    """
+
+    url = 'https://huggingface.co/datasets/torchgeo/dior/resolve/main/{}'
+
+    files = {
+        'trainval': {
+            'images': {
+                'filename': 'Images_trainval.zip',
+                'md5': '070e9314120403e5c965d12fe5321cb0',
+            },
+            'labels': {
+                'filename': 'Annotations_trainval.zip',
+                'md5': '90e045de37255c5919bbecf659b72c1a',
+            },
+        },
+        'test': {
+            'images': {
+                'filename': 'Images_test.zip',
+                'md5': '97f3cbc86de0867624a6a34190c694ae',
+            }
+        },
+    }
+
+    valid_splits = ('train', 'val', 'test')
+
+    classes = (
+        'airplane',
+        'airport',
+        'baseballfield',
+        'basketballcourt',
+        'bridge',
+        'chimney',
+        'dam',
+        'expresswayservicearea',
+        'expresswaytollstation',
+        'golffield',
+        'groundtrackfield',
+        'harbor',
+        'overpass',
+        'ship',
+        'stadium',
+        'storagetank',
+        'tenniscourt',
+        'trainstation',
+        'vehicle',
+        'windmill',
+    )
+
+    def __init__(
+        self,
+        root: Path = 'data',
+        split: str = 'train',
+        transforms: Callable[[dict[str, Tensor]], dict[str, Tensor]] | None = None,
+        download: bool = False,
+        checksum: bool = False,
+    ) -> None:
+        """Initialize a new DIOR dataset instance.
+
+        Args:
+            root: root directory where dataset can be found
+            split: split of the dataset to use, one of 'train', 'val', 'test'
+            transforms: a function/transform that takes input sample and its target as
+                entry and returns a transformed version
+            download: if True, download dataset and store it in the root directory
+            checksum: if True, check the MD5 of the downloaded files (may be slow)
+
+        Raises:
+            DatasetNotFoundError: If dataset is not found and *download* is False.
+            AssertionError: If *split* argumnet is invalid.
+        """
+        self.root = root
+        self.transforms = transforms
+        self.checksum = checksum
+        self.download = download
+
+        assert split in self.valid_splits, f'Split must be one of {self.valid_splits}.'
+        self.split = split
+
+        self._verify()
+
+        self.sample_df = pd.read_parquet(os.path.join(self.root, 'sample_df.parquet'))
+
+        self.sample_df = self.sample_df[
+            self.sample_df['split'] == self.split
+        ].reset_index(drop=True)
+
+        self.class_to_idx: dict[str, int] = {c: i for i, c in enumerate(self.classes)}
+
+    def __len__(self) -> int:
+        """Return the number of data points in the dataset.
+
+        Returns:
+            length of the dataset
+        """
+        return len(self.sample_df)
+
+    def __getitem__(self, idx: int) -> dict[str, Tensor]:
+        """Return an index within the dataset.
+
+        Args:
+            idx: index to return
+
+        Returns:
+            data and label at that index
+        """
+        sample = self.sample_df.iloc[idx]
+
+        image = self._load_image(os.path.join(self.root, sample['image_path']))
+
+        if self.split != 'test':
+            boxes, labels = self._load_target(
+                os.path.join(self.root, sample['label_path'])
+            )
+
+            sample = {'image': image, 'boxes': boxes, 'labels': labels}
+        else:
+            sample = {'image': image}
+
+        if self.transforms is not None:
+            sample = self.transforms(sample)
+
+        return sample
+
+    def _load_image(self, path: Path) -> Tensor:
+        """Load a single image.
+
+        Args:
+            path: path to the image
+
+        Returns:
+            the image
+        """
+        with Image.open(path) as img:
+            array: np.typing.NDArray[np.int_] = np.array(img.convert('RGB'))
+            tensor: Tensor = torch.from_numpy(array)
+            # Convert from HxWxC to CxHxW
+            tensor = tensor.permute((2, 0, 1))
+            return tensor
+
+    def _load_target(self, path: Path) -> tuple[Tensor, Tensor]:
+        """Load the target mask for a single image.
+
+        Args:
+            path: path to the annotation file
+
+        Returns:
+            the target bounding boxes and labels
+        """
+        parsed = parse_pascal_voc(path)
+        boxes = torch.tensor(parsed['bboxes'], dtype=torch.float32)
+        labels = torch.tensor(
+            [self.class_to_idx[label] for label in parsed['labels']]
+        ).long()
+        return boxes, labels
+
+    def _verify(self) -> None:
+        """Verify the integrity of the dataset."""
+        df_path = os.path.join(self.root, 'sample_df.parquet')
+        exists = []
+        if os.path.exists(df_path):
+            exists.append(True)
+            df = pd.read_parquet(df_path)
+            df = df[df['split'] == self.split].reset_index(drop=True)
+            for idx, row in df.iterrows():
+                if os.path.exists(os.path.join(self.root, row['image_path'])):
+                    exists.append(True)
+                else:
+                    exists.append(False)
+        else:
+            exists.append(False)
+
+        if all(exists):
+            return
+
+        exists = []
+        if self.split in ['train', 'val']:
+            files = self.files['trainval']
+        else:
+            files = self.files['test']
+
+        for key in files:
+            filename = files[key]['filename']
+            md5 = files[key]['md5']
+            path = os.path.join(self.root, filename)
+            if os.path.exists(path):
+                if self.checksum and not check_integrity(path, md5):
+                    raise RuntimeError('Dataset found, but corrupted.')
+                extract_archive(path)
+                exists.append(True)
+            else:
+                exists.append(False)
+
+        if all(exists):
+            return
+
+        if not self.download:
+            raise DatasetNotFoundError(self)
+
+        self._download()
+
+    def _download(self) -> None:
+        """Downlaod the dataset and extract it."""
+        if self.split in ['train', 'val']:
+            files = self.files['trainval']
+        else:
+            files = self.files['test']
+
+        for key in files:
+            filename = files[key]['filename']
+            md5 = files[key]['md5']
+            download_and_extract_archive(
+                self.url.format(filename),
+                self.root,
+                filename=filename,
+                md5=md5 if self.checksum else None,
+            )
+
+        # download the sample_df.parquet file
+        download_url(
+            self.url.format('sample_df.parquet'),
+            self.root,
+            filename='sample_df.parquet',
+        )
+
+    def plot(
+        self,
+        sample: dict[str, Tensor],
+        show_titles: bool = True,
+        suptitle: str | None = None,
+        box_alpha: float = 0.7,
+    ) -> Figure:
+        """Plot a sample from the dataset.
+
+        Args:
+            sample: a sample returned by :meth:`__getitem__`
+            show_titles: flag indicating whether to show titles above each panel
+            suptitle: optional string to use as a suptitle
+            box_alpha: alpha value for boxes
+
+        Returns:
+            a matplotlib Figure with the rendered sample
+        """
+        image = sample['image'].permute((1, 2, 0)).numpy()
+        boxes = sample['boxes'].numpy()
+        labels = sample['labels'].numpy()
+
+        fig, axs = plt.subplots(ncols=1, figsize=(10, 10))
+
+        axs.imshow(image)
+        axs.axis('off')
+
+        cm = plt.get_cmap('gist_rainbow')
+
+        for box, label_idx in zip(boxes, labels):
+            color = cm(label_idx / len(self.classes))
+            label = self.classes[label_idx]
+
+            # Horizontal box: [xmin, ymin, xmax, ymax]
+            x1, y1, x2, y2 = box
+            rect = patches.Rectangle(
+                (x1, y1),
+                x2 - x1,
+                y2 - y1,
+                linewidth=2,
+                alpha=box_alpha,
+                linestyle='solid',
+                edgecolor=color,
+                facecolor='none',
+            )
+            axs.add_patch(rect)
+            # Add label above box
+            axs.text(
+                x1,
+                y1 - 5,
+                label,
+                color='white',
+                fontsize=8,
+                bbox=dict(facecolor=color, alpha=box_alpha),
+            )
+
+        if suptitle is not None:
+            plt.suptitle(suptitle)
+
+        return fig

From 08cd8395854709e58ba870f082976c8acc908835 Mon Sep 17 00:00:00 2001
From: Nils Lehmann <nils.lehmann24@gmail.com>
Date: Mon, 10 Feb 2025 17:37:09 +0000
Subject: [PATCH 2/8] init

---
 torchgeo/datasets/__init__.py | 2 ++
 1 file changed, 2 insertions(+)

diff --git a/torchgeo/datasets/__init__.py b/torchgeo/datasets/__init__.py
index 8177120c2a7..fa976e9cc03 100644
--- a/torchgeo/datasets/__init__.py
+++ b/torchgeo/datasets/__init__.py
@@ -37,6 +37,7 @@
 from .deepglobelandcover import DeepGlobeLandCover
 from .dfc2022 import DFC2022
 from .digital_typhoon import DigitalTyphoon
+from .dior import DIOR
 from .eddmaps import EDDMapS
 from .enviroatlas import EnviroAtlas
 from .errors import DatasetNotFoundError, DependencyNotFoundError, RGBBandsMissingError
@@ -156,6 +157,7 @@
     'BRIGHTDFC2025',
     'CDL',
     'COWC',
+    'DIOR',
     'DFC2022',
     'ETCI2021',
     'EUDEM',

From 4409f164f05adb48ee58ef7104b8e58e8e65af63 Mon Sep 17 00:00:00 2001
From: Nils Lehmann <nils.lehmann24@gmail.com>
Date: Mon, 10 Feb 2025 17:38:45 +0000
Subject: [PATCH 3/8] naming convention

---
 tests/datasets/test_dior.py | 2 +-
 torchgeo/datasets/dior.py   | 4 ++--
 2 files changed, 3 insertions(+), 3 deletions(-)

diff --git a/tests/datasets/test_dior.py b/tests/datasets/test_dior.py
index 5463da333e1..3321490e542 100644
--- a/tests/datasets/test_dior.py
+++ b/tests/datasets/test_dior.py
@@ -74,7 +74,7 @@ def test_getitem(self, dataset: DIOR) -> None:
         assert x['image'].ndim == 3
         assert isinstance(x['image'], torch.Tensor)
         if dataset.split != 'test':
-            assert isinstance(x['labels'], torch.Tensor)
+            assert isinstance(x['label'], torch.Tensor)
             assert isinstance(x['boxes'], torch.Tensor)
 
     def test_len(self, dataset: DIOR) -> None:
diff --git a/torchgeo/datasets/dior.py b/torchgeo/datasets/dior.py
index 07af4e8e8cc..e45ada374fb 100644
--- a/torchgeo/datasets/dior.py
+++ b/torchgeo/datasets/dior.py
@@ -221,7 +221,7 @@ def __getitem__(self, idx: int) -> dict[str, Tensor]:
                 os.path.join(self.root, sample['label_path'])
             )
 
-            sample = {'image': image, 'boxes': boxes, 'labels': labels}
+            sample = {'image': image, 'bbox_xyxy': boxes, 'label': labels}
         else:
             sample = {'image': image}
 
@@ -351,7 +351,7 @@ def plot(
         """
         image = sample['image'].permute((1, 2, 0)).numpy()
         boxes = sample['boxes'].numpy()
-        labels = sample['labels'].numpy()
+        labels = sample['label'].numpy()
 
         fig, axs = plt.subplots(ncols=1, figsize=(10, 10))
 

From d80136d8022cc79a26b9aec3252d9a5b312eb12c Mon Sep 17 00:00:00 2001
From: Nils Lehmann <nils.lehmann24@gmail.com>
Date: Tue, 11 Feb 2025 09:29:51 +0100
Subject: [PATCH 4/8] tests

---
 tests/data/dior/data.py     |  6 +++---
 tests/datasets/test_dior.py | 11 ++---------
 torchgeo/datasets/dior.py   | 27 +++++++++++++--------------
 3 files changed, 18 insertions(+), 26 deletions(-)

diff --git a/tests/data/dior/data.py b/tests/data/dior/data.py
index a428a41c7e3..f89f61a3e09 100644
--- a/tests/data/dior/data.py
+++ b/tests/data/dior/data.py
@@ -7,10 +7,10 @@
 import os
 import shutil
 import xml.etree.ElementTree as ET
-import pandas as pd
+
 import numpy as np
+import pandas as pd
 from PIL import Image
-from pathlib import Path
 
 # Constants
 SIZE = 32  # DIOR uses 800x800 but smaller for tests
@@ -78,7 +78,7 @@ def create_annotation(path: str, image_name: str) -> None:
     tree.write(path)
 
 
-def create_dataset():
+def create_dataset() -> None:
     """Create dummy DIOR dataset."""
     root = os.getcwd()
 
diff --git a/tests/datasets/test_dior.py b/tests/datasets/test_dior.py
index 3321490e542..4dae4ea50a7 100644
--- a/tests/datasets/test_dior.py
+++ b/tests/datasets/test_dior.py
@@ -12,7 +12,7 @@
 from _pytest.fixtures import SubRequest
 from pytest import MonkeyPatch
 
-from torchgeo.datasets import DatasetNotFoundError, DIOR
+from torchgeo.datasets import DIOR, DatasetNotFoundError
 
 
 class TestDIOR:
@@ -75,7 +75,7 @@ def test_getitem(self, dataset: DIOR) -> None:
         assert isinstance(x['image'], torch.Tensor)
         if dataset.split != 'test':
             assert isinstance(x['label'], torch.Tensor)
-            assert isinstance(x['boxes'], torch.Tensor)
+            assert isinstance(x['bbox_xyxy'], torch.Tensor)
 
     def test_len(self, dataset: DIOR) -> None:
         if dataset.split == 'train':
@@ -98,10 +98,3 @@ def test_plot(self, dataset: DIOR) -> None:
             x = dataset[0].copy()
             dataset.plot(x, suptitle='Test')
             plt.close()
-
-    def test_plot_prediction(self, dataset: DIOR) -> None:
-        if dataset.split != 'test':
-            x = dataset[0].copy()
-            x['prediction_boxes'] = x['boxes'].clone()
-            dataset.plot(x, suptitle='Prediction')
-            plt.close()
diff --git a/torchgeo/datasets/dior.py b/torchgeo/datasets/dior.py
index e45ada374fb..e0f8d32c89f 100644
--- a/torchgeo/datasets/dior.py
+++ b/torchgeo/datasets/dior.py
@@ -3,20 +3,19 @@
 
 """DIOR dataset."""
 
-import glob
 import os
 from collections.abc import Callable
-from typing import Any
+from typing import Any, ClassVar
 from xml.etree import ElementTree
 
 import matplotlib.patches as patches
 import matplotlib.pyplot as plt
 import numpy as np
+import pandas as pd
 import torch
 from matplotlib.figure import Figure
 from PIL import Image
 from torch import Tensor
-import pandas as pd
 
 from .errors import DatasetNotFoundError
 from .geo import NonGeoDataset
@@ -24,8 +23,8 @@
     Path,
     check_integrity,
     download_and_extract_archive,
-    extract_archive,
     download_url,
+    extract_archive,
 )
 
 
@@ -51,7 +50,7 @@ def parse_pascal_voc(path: Path) -> dict[str, Any]:
             int(bndbox.find('xmax').text),  # type: ignore[union-attr, arg-type]
             int(bndbox.find('ymax').text),  # type: ignore[union-attr, arg-type]
         ]
-        label = obj.find('name').text
+        label = obj.find('name').text  # type: ignore[union-attr, arg-type]
         bboxes.append(bbox)
         labels.append(label)
 
@@ -111,7 +110,7 @@ class DIOR(NonGeoDataset):
 
     url = 'https://huggingface.co/datasets/torchgeo/dior/resolve/main/{}'
 
-    files = {
+    files: ClassVar[dict[str, dict[str, dict[str, str]]]] = {
         'trainval': {
             'images': {
                 'filename': 'Images_trainval.zip',
@@ -212,18 +211,18 @@ def __getitem__(self, idx: int) -> dict[str, Tensor]:
         Returns:
             data and label at that index
         """
-        sample = self.sample_df.iloc[idx]
+        row = self.sample_df.iloc[idx]
 
-        image = self._load_image(os.path.join(self.root, sample['image_path']))
+        image = self._load_image(os.path.join(self.root, row['image_path']))
+
+        sample: dict[str, Tensor] = {'image': image}
 
         if self.split != 'test':
             boxes, labels = self._load_target(
-                os.path.join(self.root, sample['label_path'])
+                os.path.join(self.root, row['label_path'])
             )
-
-            sample = {'image': image, 'bbox_xyxy': boxes, 'label': labels}
-        else:
-            sample = {'image': image}
+            sample['bbox_xyxy'] = boxes
+            sample['label'] = labels
 
         if self.transforms is not None:
             sample = self.transforms(sample)
@@ -350,7 +349,7 @@ def plot(
             a matplotlib Figure with the rendered sample
         """
         image = sample['image'].permute((1, 2, 0)).numpy()
-        boxes = sample['boxes'].numpy()
+        boxes = sample['bbox_xyxy'].numpy()
         labels = sample['label'].numpy()
 
         fig, axs = plt.subplots(ncols=1, figsize=(10, 10))

From 3863f0118dd2214929c3f6773c5d45248e6bc9d4 Mon Sep 17 00:00:00 2001
From: Nils Lehmann <nils.lehmann24@gmail.com>
Date: Tue, 11 Feb 2025 09:36:54 +0100
Subject: [PATCH 5/8] tests

---
 torchgeo/datasets/__init__.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/torchgeo/datasets/__init__.py b/torchgeo/datasets/__init__.py
index 6b2dd80f4ec..fea07cf9931 100644
--- a/torchgeo/datasets/__init__.py
+++ b/torchgeo/datasets/__init__.py
@@ -158,8 +158,8 @@
     'BRIGHTDFC2025',
     'CDL',
     'COWC',
-    'DIOR',
     'DFC2022',
+    'DIOR',
     'ETCI2021',
     'EUDEM',
     'FAIR1M',

From 7d1f3c3233e6d0239984a55a76365c9056c6a7bd Mon Sep 17 00:00:00 2001
From: Nils Lehmann <nils.lehmann24@gmail.com>
Date: Tue, 11 Feb 2025 09:51:34 +0100
Subject: [PATCH 6/8] import skip

---
 tests/datasets/test_dior.py | 2 ++
 1 file changed, 2 insertions(+)

diff --git a/tests/datasets/test_dior.py b/tests/datasets/test_dior.py
index 4dae4ea50a7..6d48f77759c 100644
--- a/tests/datasets/test_dior.py
+++ b/tests/datasets/test_dior.py
@@ -14,6 +14,8 @@
 
 from torchgeo.datasets import DIOR, DatasetNotFoundError
 
+pytest.importorskip('pyarrow')
+
 
 class TestDIOR:
     @pytest.fixture(params=['train', 'val', 'test'])

From cb5e807994ddaeffb8c0d7802a869a7eb0f8bbc1 Mon Sep 17 00:00:00 2001
From: Nils Lehmann <nils.lehmann24@gmail.com>
Date: Wed, 12 Feb 2025 08:34:08 +0100
Subject: [PATCH 7/8] myp

---
 torchgeo/datasets/dior.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/torchgeo/datasets/dior.py b/torchgeo/datasets/dior.py
index e0f8d32c89f..008dd5623d4 100644
--- a/torchgeo/datasets/dior.py
+++ b/torchgeo/datasets/dior.py
@@ -50,7 +50,7 @@ def parse_pascal_voc(path: Path) -> dict[str, Any]:
             int(bndbox.find('xmax').text),  # type: ignore[union-attr, arg-type]
             int(bndbox.find('ymax').text),  # type: ignore[union-attr, arg-type]
         ]
-        label = obj.find('name').text  # type: ignore[union-attr, arg-type]
+        label = obj.find('name').text  # type: ignore[union-attr]
         bboxes.append(bbox)
         labels.append(label)
 

From 391e74753c5e3b4babef6a9b98b0e71a3f13a1bc Mon Sep 17 00:00:00 2001
From: Nils Lehmann <nils.lehmann24@gmail.com>
Date: Mon, 17 Feb 2025 08:43:40 +0100
Subject: [PATCH 8/8] requests

---
 torchgeo/datasets/dior.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/torchgeo/datasets/dior.py b/torchgeo/datasets/dior.py
index 008dd5623d4..0f6c412f2d6 100644
--- a/torchgeo/datasets/dior.py
+++ b/torchgeo/datasets/dior.py
@@ -108,7 +108,7 @@ class DIOR(NonGeoDataset):
     .. versionadded:: 0.7
     """
 
-    url = 'https://huggingface.co/datasets/torchgeo/dior/resolve/main/{}'
+    url = 'https://hf.co/datasets/torchgeo/dior/resolve/ec7be9567d2e08eb3d3401c15a52ee2145d0ef01/{}'
 
     files: ClassVar[dict[str, dict[str, dict[str, str]]]] = {
         'trainval': {