Code source de transformation.georeference

"""
Module de transformation des données de géoréférencement.

Ce module contient les fonctions de géoréférencement des données de bathymétrie.
"""

from multiprocessing import cpu_count

from cachetools import LRUCache
import geopandas as gpd
import i18n
import numpy as np
from loguru import logger
import pandas as pd
from typing import Optional, Protocol

from .exception_tranformation import WaterLevelDataRequiredError
from . import order
from .transformation_models import SensorProtocol, WaterlineProtocol
from . import uncertainty
import schema
from schema import model_ids as schema_ids
from processing_context import ProcessingContext

LOGGER = logger.bind(name="CSB-Processing.Transformation.Georeferencing")

event_dates_cache = LRUCache(maxsize=128)

CPU_COUNT: int = cpu_count()



[docs]
class GeoreferenceTideConfigProtocol(Protocol):
    """Configuration de géoréférencement des marées."""

    water_level_tolerance: pd.Timedelta




[docs]
class UncertaintyConfigProtocol(Protocol):
    """Configuration de géoréférencement des incertitudes."""

    tvu: uncertainty.TVUConfigProtocol
    thu: uncertainty.THUConfigProtocol




[docs]
class GeoreferenceConfigProtocol(Protocol):
    """Configuration de géoréférencement."""

    tide: GeoreferenceTideConfigProtocol
    uncertainty: UncertaintyConfigProtocol




[docs]
def _validate_and_sort_data(water_level_data: dict[str, pd.DataFrame]) -> None:
    """
    Valide et trie les données de niveau d'eau.

    :param water_level_data: Niveau d'eau.
    :type water_level_data: dict[str, pd.DataFrame[schema.WaterLevelSerieDataWithMetaDataSchema]]
    """
    LOGGER.debug(i18n.t("transformation.georeference.validate_sort_water_level"))

    for water_level_df in water_level_data.values():
        schema.validate_schema(
            data=water_level_df, schema=schema.WaterLevelSerieDataWithMetaDataSchema
        )

        LOGGER.debug(
            i18n.t(
                "transformation.georeference.water_level_dataframe_validated",
                station_id=water_level_df.attrs.get(schema_ids.STATION_ID),
            )
        )

        water_level_df.sort_values(by=schema_ids.EVENT_DATE, inplace=True)




[docs]
def _get_event_dates(station_id: str, water_level_df: pd.DataFrame) -> pd.DatetimeIndex:
    """
    Récupère les dates des événements avec mise en cache.

    :param station_id: Identifiant de la station.
    :type station_id: str
    :param water_level_df: DataFrame contenant les niveaux d'eau.
    :type water_level_df: pd.DataFrame[schema.WaterLevelSerieDataWithMetaDataSchema]
    :return: Index des dates des événements.
    :rtype: pd.DatetimeIndex[pd.Timestamp]
    """
    cache_key: str = (
        f"{station_id}-{water_level_df.attrs[schema_ids.START_TIME]}"
        f"-{water_level_df.attrs[schema_ids.END_TIME]}-{len(water_level_df)}"
    )

    # Mise en cache des dates des événements
    if cache_key not in event_dates_cache:
        event_dates = pd.to_datetime(water_level_df[schema_ids.EVENT_DATE].values)

        if event_dates.tz is None:
            event_dates = event_dates.tz_localize("UTC")

        event_dates_cache[cache_key] = event_dates

    return event_dates_cache[cache_key]




[docs]
def get_water_levels_vectorized(
    data: gpd.GeoDataFrame,
    water_level_data: dict[str, pd.DataFrame],
    water_level_tolerance: pd.Timedelta,
) -> gpd.GeoDataFrame:
    """
    Ajoute le niveau d'eau aux données de profondeur de manière vectorisée.

    :param data: Données brutes de profondeur.
    :type data: gpd.GeoDataFrame[schema.DataLoggerWithTideZoneSchema]
    :param water_level_data: Niveau d'eau.
    :type water_level_data: dict[str, pd.DataFrame[schema.WaterLevelSerieDataWithMetaDataSchema]]
    :param water_level_tolerance: Tolérance de temps pour la récupération de la valeur du niveau d'eau.
    :type water_level_tolerance: pd.Timedelta
    :return: Données de profondeur avec le niveau d'eau.
    :rtype: gpd.GeoDataFrame[schema.DataLoggerWithTideZoneSchema]
    """
    _validate_and_sort_data(water_level_data)

    LOGGER.debug(
        i18n.t("transformation.georeference.fetching_water_levels", count=len(data))
    )

    # Initialiser les colonnes de résultat directement dans le DataFrame original
    data.loc[:, schema_ids.WATER_LEVEL_METER] = np.nan
    data.loc[:, schema_ids.TIME_SERIE] = None

    # Grouper par tide_zone_id pour traitement vectorisé
    for tide_zone_id, zone_group in data.groupby(schema_ids.TIDE_ZONE_ID):
        if tide_zone_id not in water_level_data or water_level_data[tide_zone_id].empty:
            continue

        water_level_df = water_level_data[tide_zone_id]
        event_dates_wl = _get_event_dates(tide_zone_id, water_level_df)

        # Vectoriser la recherche de positions
        time_utc_values = zone_group[schema_ids.TIME_UTC]
        positions_after = event_dates_wl.searchsorted(time_utc_values, side="right")

        # Calculer les masques pour différents cas
        exact_match_mask = np.zeros(len(positions_after), dtype=bool)
        valid_positions = (positions_after > 0) & (
            positions_after <= len(event_dates_wl)
        )

        valid_positions_mask = (positions_after > 0) & (
            positions_after <= len(event_dates_wl)
        )
        valid_indices = np.where(valid_positions_mask)[0]

        if len(valid_indices) > 0:
            # Get the corresponding event dates for valid positions
            event_times_to_check = event_dates_wl[positions_after[valid_indices] - 1]
            time_values_to_check = time_utc_values.iloc[valid_indices]

            # Vectorized comparison
            matches = event_times_to_check == time_values_to_check.values
            exact_match_mask[valid_indices] = matches

        # Traiter les correspondances exactes
        exact_indices = zone_group.index[exact_match_mask]
        exact_positions = positions_after[exact_match_mask] - 1

        if len(exact_indices) > 0:
            data.loc[exact_indices, schema_ids.WATER_LEVEL_METER] = (
                water_level_df.iloc[exact_positions][schema_ids.VALUE].round(3).values
            )
            data.loc[exact_indices, schema_ids.TIME_SERIE] = water_level_df.iloc[
                exact_positions
            ][schema_ids.TIME_SERIE_CODE].values

        # Traiter les cas nécessitants interpolation/tolérance
        non_exact_mask = ~exact_match_mask & valid_positions
        if non_exact_mask.any():
            _process_non_exact_matches(
                data,
                zone_group,
                non_exact_mask,
                positions_after,
                water_level_df,
                event_dates_wl,
                time_utc_values,
                water_level_tolerance,
            )

    LOGGER.debug(
        i18n.t(
            "transformation.georeference.fetching_water_levels_done",
            remaining=data[schema_ids.WATER_LEVEL_METER].isna().sum(),
        )
    )

    return data




[docs]
def _handle_out_of_bounds_after(
    gdf: gpd.GeoDataFrame,
    indices_to_process: pd.Index,
    times_to_process: pd.Series,
    positions_to_process: np.ndarray,
    event_dates_wl: pd.DatetimeIndex,
    water_level_df: pd.DataFrame,
    tolerance_seconds: float,
) -> None:
    """
    Cas où la position après est hors limites: on peut utiliser le dernier point si dans la tolérance.

    :param gdf: GeoDataFrame des données de profondeur.
    :type gdf: gpd.GeoDataFrame[schema.DataLoggerWithTideZone
    :param indices_to_process: Indices des lignes à traiter.
    :type indices_to_process: pd.Index
    :param times_to_process: Séries temporelles des lignes à traiter.
    :type times_to_process: pd.Series[pd.Timestamp]
    :param positions_to_process: Positions après dans les données de niveau d'eau.
    :type positions_to_process: np.ndarray
    :param event_dates_wl: Dates des événements de niveau d'eau.
    :type event_dates_wl: pd.DatetimeIndex[pd.Timestamp]
    :param water_level_df: DataFrame des niveaux d'eau.
    :type water_level_df: pd.DataFrame[schema.WaterLevelSerieDataWithMetaDataSchema]
    :param tolerance_seconds: Tolérance en secondes pour la récupération du niveau d'eau.
    :type tolerance_seconds: float
    """
    out_of_bounds_after = positions_to_process >= len(event_dates_wl)
    if not out_of_bounds_after.any():
        return

    LOGGER.debug(i18n.t("transformation.georeference.out_of_bounds_after"))

    max_event_idx = len(event_dates_wl) - 1
    last_event_time = event_dates_wl[max_event_idx]
    time_diffs_last = np.abs(
        (times_to_process[out_of_bounds_after] - last_event_time).dt.total_seconds()
    )
    within_tolerance = time_diffs_last <= tolerance_seconds
    if not within_tolerance.any():
        return

    valid_indices = indices_to_process[out_of_bounds_after][within_tolerance]
    gdf.loc[valid_indices, schema_ids.WATER_LEVEL_METER] = round(
        water_level_df.iloc[max_event_idx][schema_ids.VALUE], 3
    )
    gdf.loc[valid_indices, schema_ids.TIME_SERIE] = water_level_df.iloc[max_event_idx][
        schema_ids.TIME_SERIE_CODE
    ]




[docs]
def _handle_out_of_bounds_before(
    gdf: gpd.GeoDataFrame,
    indices_to_process: pd.Index,
    times_to_process: pd.Series,
    positions_before: np.ndarray,
    event_dates_wl: pd.DatetimeIndex,
    water_level_df: pd.DataFrame,
    tolerance_seconds: float,
) -> None:
    """
    Cas où la position avant est hors limites: on peut utiliser le premier point si dans la tolérance.

    :param gdf: GeoDataFrame des données de profondeur.
    :type gdf: gpd.GeoDataFrame[schema.DataLoggerWithTideZone
    :param indices_to_process: Indices des lignes à traiter.
    :type indices_to_process: pd.Index
    :param times_to_process: Séries temporelles des lignes à traiter.
    :type times_to_process: pd.Series[pd.Timestamp]
    :param positions_before: Positions avant dans les données de niveau d'eau.
    :type positions_before: np.ndarray
    :param event_dates_wl: Dates des événements de niveau d'eau.
    :type event_dates_wl: pd.DatetimeIndex[pd.Timestamp]
    :param water_level_df: DataFrame des niveaux d'eau.
    :type water_level_df: pd.DataFrame[schema.WaterLevelSerieDataWithMetaDataSchema]
    :param tolerance_seconds: Tolérance en secondes pour la récupération du niveau d'eau.
    :type tolerance_seconds: float
    """
    out_of_bounds_before = positions_before < 0
    if not out_of_bounds_before.any():
        return

    LOGGER.debug(i18n.t("transformation.georeference.out_of_bounds_before"))

    first_event_time = event_dates_wl[0]
    time_diffs_first = np.abs(
        (times_to_process[out_of_bounds_before] - first_event_time).dt.total_seconds()
    )
    within_tolerance = time_diffs_first <= tolerance_seconds
    if not within_tolerance.any():
        return

    valid_indices = indices_to_process[out_of_bounds_before][within_tolerance]
    gdf.loc[valid_indices, schema_ids.WATER_LEVEL_METER] = round(
        water_level_df.iloc[0][schema_ids.VALUE], 3
    )
    gdf.loc[valid_indices, schema_ids.TIME_SERIE] = water_level_df.iloc[0][
        schema_ids.TIME_SERIE_CODE
    ]




[docs]
def _handle_interpolation(
    gdf: gpd.GeoDataFrame,
    indices_to_process: pd.Index,
    positions_before: np.ndarray,
    positions_to_process: np.ndarray,
    times_to_process: pd.Series,
    event_dates_wl: pd.DatetimeIndex,
    water_level_df: pd.DataFrame,
    tolerance_seconds: float,
) -> None:
    """
    Cas d'interpolation linéaire entre deux points consécutifs si dans la tolérance.

    :param gdf: GeoDataFrame des données de profondeur.
    :type gdf: gpd.GeoDataFrame[schema.DataLoggerWithTideZone
    :param indices_to_process: Indices des lignes à traiter.
    :type indices_to_process: pd.Index
    :param positions_before: Positions avant dans les données de niveau d'eau.
    :type positions_before: np.ndarray
    :param positions_to_process: Positions après dans les données de niveau d'eau.
    :type positions_to_process: np.ndarray
    :param times_to_process: Séries temporelles des lignes à traiter.
    :type times_to_process: pd.Series[pd.Timestamp]
    :param event_dates_wl: Dates des événements de niveau d'eau.
    :type event_dates_wl: pd.DatetimeIndex[pd.Timestamp]
    :param water_level_df: DataFrame des niveaux d'eau.
    :type water_level_df: pd.DataFrame[schema.WaterLevelSerieDataWithMetaDataSchema]
    :param tolerance_seconds: Tolérance en secondes pour la récupération du niveau d'eau.
    :type tolerance_seconds: float
    """
    max_len = len(event_dates_wl)
    out_of_bounds_after = positions_to_process >= max_len
    out_of_bounds_before = positions_before < 0
    valid_interpolation = ~out_of_bounds_after & ~out_of_bounds_before
    if not valid_interpolation.any():
        return

    LOGGER.debug(i18n.t("transformation.georeference.interpolation_needed"))

    interp_indices = indices_to_process[valid_interpolation]
    interp_pos_before = positions_before[valid_interpolation]
    interp_pos_after = positions_to_process[valid_interpolation]
    interp_times = times_to_process[valid_interpolation]

    before_events = water_level_df.iloc[interp_pos_before]
    after_events = water_level_df.iloc[interp_pos_after]

    time_diffs_event = (
        (
            after_events[schema_ids.EVENT_DATE].values
            - before_events[schema_ids.EVENT_DATE].values
        )
        .astype("timedelta64[s]")
        .astype(float)
    )

    # Exiger que l'intervalle total soit <= 2 * tolérance
    tolerance_mask = time_diffs_event <= (2 * tolerance_seconds)
    if not tolerance_mask.any():
        return

    final_indices = interp_indices[tolerance_mask]
    final_before = before_events[tolerance_mask]
    final_after = after_events[tolerance_mask]
    final_times = interp_times[tolerance_mask]
    final_time_diffs = time_diffs_event[tolerance_mask]

    value_diffs = (
        final_after[schema_ids.VALUE].values - final_before[schema_ids.VALUE].values
    )
    time_elapsed = (
        (final_times.values - final_before[schema_ids.EVENT_DATE].values)
        .astype("timedelta64[s]")
        .astype(float)
    )

    interpolated_values = final_before[schema_ids.VALUE].values + (
        value_diffs * (time_elapsed / final_time_diffs)
    )

    gdf.loc[final_indices, schema_ids.WATER_LEVEL_METER] = np.round(
        interpolated_values, 3
    )
    gdf.loc[final_indices, schema_ids.TIME_SERIE] = [
        f"LinearInterpolation[{after} - {before}]"
        for after, before in zip(
            final_after[schema_ids.TIME_SERIE_CODE].values,
            final_before[schema_ids.TIME_SERIE_CODE].values,
        )
    ]




[docs]
def _process_non_exact_matches(
    gdf: gpd.GeoDataFrame,
    zone_group: pd.DataFrame,
    mask: np.ndarray,
    positions_after: np.ndarray,
    water_level_df: pd.DataFrame,
    event_dates_wl: pd.DatetimeIndex,
    time_utc_values: pd.Series,
    water_level_tolerance: pd.Timedelta,
) -> None:
    """
    Orchestration des traitements des cas non-exacts (hors limites & interpolation).

    :param gdf: GeoDataFrame des données de profondeur.
    :type gdf: gpd.GeoDataFrame[schema.DataLoggerWithTideZone
    :param zone_group: Groupe de données pour une zone de marée spécifique.
    :type zone_group: pd.DataFrame[schema.DataLoggerWithTideZoneSchema]
    :param mask: Masque des lignes à traiter.
    :type mask: np.ndarray
    :param positions_after: Positions après dans les données de niveau d'eau.
    :type positions_after: np.ndarray
    :param water_level_df: DataFrame des niveaux d'eau.
    :type water_level_df: pd.DataFrame[schema.WaterLevelSerieDataWithMetaDataSchema]
    :param event_dates_wl: Dates des événements de niveau d'eau.
    :type event_dates_wl: pd.DatetimeIndex[pd.Timestamp]
    :param time_utc_values: Séries temporelles des lignes à traiter.
    :type time_utc_values: pd.Series[pd.Timestamp]
    :param water_level_tolerance: Tolérance en temps pour la récupération de la valeur du niveau d'eau.
    :type water_level_tolerance: pd.Timedelta
    """
    if not mask.any():
        return

    indices_to_process = zone_group.index[mask]
    positions_to_process = positions_after[mask]
    times_to_process = time_utc_values[mask]
    positions_before = positions_to_process - 1
    tolerance_seconds = water_level_tolerance.total_seconds()

    _handle_out_of_bounds_after(
        gdf=gdf,
        indices_to_process=indices_to_process,
        times_to_process=times_to_process,
        positions_to_process=positions_to_process,
        event_dates_wl=event_dates_wl,
        water_level_df=water_level_df,
        tolerance_seconds=tolerance_seconds,
    )

    _handle_out_of_bounds_before(
        gdf=gdf,
        indices_to_process=indices_to_process,
        times_to_process=times_to_process,
        positions_before=positions_before,
        event_dates_wl=event_dates_wl,
        water_level_df=water_level_df,
        tolerance_seconds=tolerance_seconds,
    )

    _handle_interpolation(
        gdf=gdf,
        indices_to_process=indices_to_process,
        positions_before=positions_before,
        positions_to_process=positions_to_process,
        times_to_process=times_to_process,
        event_dates_wl=event_dates_wl,
        water_level_df=water_level_df,
        tolerance_seconds=tolerance_seconds,
    )




[docs]
def get_zero_water_levels(data: gpd.GeoDataFrame) -> gpd.GeoDataFrame:
    """
    Applique un niveau d'eau de 0 aux données de profondeur.

    :param data: Données brutes de profondeur.
    :type data: gpd.GeoDataFrame[schema.DataLoggerWithTideZoneSchema]
    :return: Données de profondeur brutes avec un niveau d'eau de 0.
    :rtype: gpd.GeoDataFrame[schema.DataLoggerWithTideZoneSchema]
    """
    LOGGER.debug(
        i18n.t("transformation.georeference.zero_water_level", count=len(data))
    )

    data.loc[:, schema_ids.WATER_LEVEL_METER] = 0.0

    return data




[docs]
def apply_georeference_bathymetry(
    data: gpd.GeoDataFrame,
    waterline: WaterlineProtocol,
    sounder: SensorProtocol,
    decimal_precision: int,
) -> gpd.GeoDataFrame:
    """
    Applique la transformation de géoréférencement des données de bathymétrie.

    :param data: Données brutes de profondeur.
    :type data: gpd.GeoDataFrame[schema.DataLoggerWithTideZoneSchema]
    :param waterline: Données de la ligne d'eau.
    :type waterline: WaterlineProtocol
    :param sounder: Données du sondeur.
    :type sounder: SensorProtocol
    :param decimal_precision: Précision décimale pour les valeurs de profondeur.
    :type decimal_precision: int
    :return: Données de profondeur géoréférencées.
    :rtype: gpd.GeoDataFrame[schema.DataLoggerWithTideZoneSchema]
    """
    LOGGER.debug(i18n.t("transformation.georeference.applying_lever_arms"))

    data.loc[:, schema_ids.DEPTH_PROCESSED_METER] = round(
        (
            data[schema_ids.DEPTH_RAW_METER]
            - data[schema_ids.WATER_LEVEL_METER]
            - waterline.z
            + sounder.z
        ),
        decimal_precision,
    )

    return data




[docs]
def compute_order(
    data: gpd.GeoDataFrame,
) -> gpd.GeoDataFrame:
    """
    Calcule l'ordre de la TVU et de la THU des données de bathymétrie.

    :param data: Données brut de profondeur.
    :type data: gpd.GeoDataFrame[schema.DataLoggerWithTideZoneSchema]
    :return: Données de profondeur avec l'ordre de la TVU et de la THU.
    :rtype: gpd.GeoDataFrame[schema.DataLoggerWithTideZoneSchema]
    """
    LOGGER.debug(i18n.t("transformation.georeference.computing_iho_order"))

    depths = data[schema_ids.DEPTH_RAW_METER].values
    tvus = data[schema_ids.UNCERTAINTY].values
    thus = data[schema_ids.THU].values

    # Calcul vectorisé des ordres avec les fonctions optimisées
    tvu_orders = order.calculate_vertical_order_vectorized(depths, tvus)
    thu_orders = order.calculate_horizontal_order_vectorized(depths, thus)

    # Maximum des deux ordres
    final_orders = np.maximum(tvu_orders, thu_orders)
    data.loc[:, schema_ids.IHO_ORDER] = pd.Series(final_orders, index=data.index).map(
        order.ORDER_NAME_MAP
    )

    return data




[docs]
@schema.validate_schemas(
    data=schema.DataLoggerWithTideZoneSchema,
    return_schema=schema.DataLoggerWithTideZoneSchema,
)
def georeference_bathymetry(
    data: gpd.GeoDataFrame,
    waterline: WaterlineProtocol,
    sounder: SensorProtocol,
    georeference_config: GeoreferenceConfigProtocol,
    water_level: Optional[dict[str, pd.DataFrame]] = None,
    decimal_precision: Optional[int] = 2,
    overwrite: Optional[bool] = False,
    apply_water_level: Optional[bool] = True,
    processing_context: Optional[ProcessingContext] = None,
) -> gpd.GeoDataFrame:
    """
    Géoréférence les données de bathymétrie.

    :param data: Données brutes de profondeur.
    :type data: gpd.GeoDataFrame[schema.DataLoggerWithTideZoneSchema]
    :param waterline: Données de la ligne d'eau.
    :type waterline: WaterlineProtocol
    :param sounder: Données du sondeur.
    :type sounder: SensorProtocol
    :param water_level: Niveau d'eau.
    :type water_level: Optional[dict[str, pd.DataFrame[schema.WaterLevelSerieDataWithMetaDataSchema]]]
    :param georeference_config: Configuration de géoréférencement.
    :type georeference_config: GeoreferenceConfigProtocol
    :param decimal_precision: Précision décimale pour les valeurs de profondeur.
    :type decimal_precision: Optional[int]
    :param overwrite: Géoréférencer les données de profondeur même si elles ont déjà été géoréférencées.
    :type overwrite: Optional[bool]
    :param apply_water_level: True pour appliquer le niveau d'eau, sinon un niveau d'eau de 0 sera appliqué.
    :type apply_water_level: Optional[bool]
    :param processing_context: Contexte de traitement. Porte le type de capteur et le statut de
        réduction au zéro des cartes, utilisés pour résoudre les constantes THU/TVU depuis
        ``datalogger_uncertainty.json``.
    :type processing_context: Optional[ProcessingContext]
    :rtype: gpd.GeoDataFrame[schema.DataLoggerWithTideZoneSchema]
    :raises WaterLevelDataRequiredError: Erreur si les données de niveau d'eau sont requises.
    """
    if apply_water_level and water_level is None:
        raise WaterLevelDataRequiredError()

    data_to_process: gpd.GeoDataFrame[schema.DataLoggerWithTideZoneSchema] = (
        data if overwrite else data[data[schema_ids.DEPTH_PROCESSED_METER].isna()]
    )

    LOGGER.info(
        i18n.t(
            "transformation.georeference.georeferencing_soundings",
            count=f"{len(data_to_process):,}",
        )
    )

    LOGGER.info(i18n.t("transformation.georeference.retrieving_water_levels"))
    data_to_process: gpd.GeoDataFrame[schema.DataLoggerWithTideZoneSchema] = (
        (
            get_water_levels_vectorized(
                data=data_to_process,
                water_level_data=water_level,
                water_level_tolerance=georeference_config.tide.water_level_tolerance,
            )
        )
        if apply_water_level
        else get_zero_water_levels(data=data_to_process)
    )

    LOGGER.info(i18n.t("transformation.georeference.applying_water_levels_lever_arms"))
    data_to_process: gpd.GeoDataFrame[schema.DataLoggerWithTideZoneSchema] = (
        apply_georeference_bathymetry(
            data=data_to_process,
            waterline=waterline,
            sounder=sounder,
            decimal_precision=decimal_precision,
        )
    )

    LOGGER.info(i18n.t("transformation.georeference.computing_tvu"))
    data_to_process: gpd.GeoDataFrame[schema.DataLoggerWithTideZoneSchema] = (
        uncertainty.compute_tvu(
            data=data_to_process,
            decimal_precision=decimal_precision,
            tvu_config=georeference_config.uncertainty.tvu,
            apply_water_level=apply_water_level,
            processing_context=processing_context,
        )
    )

    LOGGER.info(i18n.t("transformation.georeference.computing_thu"))
    data_to_process: gpd.GeoDataFrame[schema.DataLoggerWithTideZoneSchema] = (
        uncertainty.compute_thu(
            data=data_to_process,
            decimal_precision=decimal_precision,
            thu_config=georeference_config.uncertainty.thu,
            processing_context=processing_context,
        )
    )

    LOGGER.info(i18n.t("transformation.georeference.computing_order"))
    data_to_process: gpd.GeoDataFrame[schema.DataLoggerWithTideZoneSchema] = (
        compute_order(data=data_to_process)
    )

    data.update(data_to_process)  # Mise à jour des données

    LOGGER.info(i18n.t("transformation.georeference.georeferencing_done"))
    LOGGER.success(
        i18n.t(
            "transformation.georeference.soundings_georeferenced",
            count=f"{data_to_process['Depth_processed_meter'].notna().sum():,}",
        )
    )

    depth_nan: np.int64 = data[schema_ids.DEPTH_PROCESSED_METER].isna().sum()
    if depth_nan > 0:
        LOGGER.warning(
            i18n.t(
                "transformation.georeference.remaining_soundings_without_depth",
                count=f"{depth_nan:,}",
            )
        )

    return data