ENG: The paper “Token-Based Global-Local Framework for Building Change Detection” by Bianca-Cerasela-Zelia Blaga, published in the IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing (JSTARS), introduces RADNet, a Region-Aware Dual-path Network for building change detection in high-resolution remote sensing imagery. The study addresses the limitations of existing deep learning models that typically rely on uniform patch-based tokenization and global feature fusion, which often fail to preserve building-level semantics and temporal consistency. To overcome these challenges, the proposed architecture integrates an Instance-Consistent Tokenizer (ICT), which generates semantically aligned object-level tokens, and a Global-Local Attention Encoder (GLAE), which captures both contextual dependencies and geometric details.

The framework is further enhanced by a Cross-Temporal Cross-Scale Decoder (CTCSD) and a Correlation-Based Prediction Head (CBPH), designed to align tokens across time and scale and to compute semantic similarity through cosine correlation. These components enable the generation of dense and interpretable change maps with high boundary precision. Extensive experiments on the EGY-BCD, LEVIR-CD, and SYSU-CD datasets demonstrate that RADNet achieves state-of-the-art results, surpassing CNN, hybrid, and transformer-based baselines. Performance gains are especially evident in Intersection over Union (IoU) and F1 metrics, confirming the robustness of the approach in diverse urban scenes and complex land-cover transitions.
Overall, the paper highlights the advantages of incorporating instance-aware tokenization and correlation-based reasoning into change detection pipelines. While challenges remain in handling low-contrast areas and subtle small-scale changes, RADNet provides a solid foundation for further research. The modular architecture is particularly promising for extensions such as multimodal fusion, self-supervised learning, and uncertainty-aware predictions, making it highly relevant for operational applications in urban monitoring, disaster response, and infrastructure management.

RO: Articolul „Token-Based Global-Local Framework for Building Change Detection” de Bianca-Cerasela-Zelia Blaga, publicat în IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing (JSTARS), prezintă RADNet, o rețea cu două căi conștientă de regiuni, destinată detectării modificărilor clădirilor în imagini de teledetecție cu rezoluție înaltă. Studiul abordează limitările modelelor actuale de învățare profundă, care se bazează în general pe tokenizare uniformă a patch-urilor și pe fuziune globală a caracteristicilor, metodă ce nu reușește să redea corect semnificația la nivel de clădire și consistența temporală. Pentru a depăși aceste limite, arhitectura propusă integrează un Tokenizator Consistent la Nivel de Instanță (TCI), care generează reprezentări asociate fiecărei clădiri, și un Codificator cu Atenție Global-Locală (CAGL), care surprinde atât relațiile contextuale de ansamblu, cât și detaliile geometrice fine.
Cadrul este extins printr-un Decodificator Trans-Temporal și Multi-Scală (DTMS) și un Cap de Predicție Bazat pe Corelație (CPBC), concepute pentru a alinia reprezentările la diferite momente și scări și pentru a calcula similaritatea semantică prin corelație cosinus. Aceste componente permit obținerea unor hărți de schimbare detaliate și interpretabile, cu precizie ridicată la nivelul contururilor. Testele pe seturile de date EGY-BCD, LEVIR-CD și SYSU-CD arată că RADNet obține rezultate de vârf, depășind modelele bazate pe rețele convoluționale, hibride sau transformeri. Progresul este evident în special la metricile Coeficientului de Suprapunere (IoU) și F1, confirmând robustețea metodei în scene urbane complexe și în tranziții de tip utilizare a terenului.
În concluzie, articolul subliniază avantajele introducerii unei tokenizări orientate pe instanțe și a unui raționament bazat pe corelații în detectarea modificărilor. Deși există în continuare dificultăți în cazul zonelor cu contrast redus sau al modificărilor foarte subtile, RADNet constituie o bază solidă pentru cercetări viitoare. Datorită designului modular, este potrivit pentru extinderi precum fuziunea multimodală, învățarea auto-supervizată sau predicțiile cu estimarea incertitudinii, având potențial aplicativ în monitorizarea urbană, gestionarea infrastructurii și intervenții post-dezastru.
Paper: B. -C. -Z. Blaga, “Token-Based Global-Local Framework for Building Change Detection,” in IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, doi: 10.1109/JSTARS.2025.3609073.
