bounding box

En rektangulær afgrænsning omkring et objekt i et billede, typisk defineret ved koordinaterne for hjørnerne (x_min, y_min, x_max, y_max) eller (center, bredde, højde).

Kort fortalt

En bounding box er en boks, der markerer præcis, hvor et objekt befinder sig i et billede, f.eks. en bil eller et ansigt.

Kategori
begreb
Niveau
begynder
Udtale
/ˈbaʊndɪŋ bɒks/

Betydninger

2
  1. 1

    Den almindelige aksejusterede bounding box (AABB), hvor siderne er parallelle med billedets kanter. Den beskrives ofte med fire værdier: x_min, y_min, x_max, y_max eller centerkoordinater og dimensioner.

    • I træningsdatasættet er hver kat indkredset med en bounding box.
    • Modellen forudsiger en bounding box med koordinaterne (100, 50, 200, 150).
  2. 2

    En roteret bounding box (OBB), som ikke er parallel med billedets kanter, men er orienteret efter objektets retning. Den kræver en ekstra parameter (vinkel) ud over center og dimensioner.

    • Ved detektion af skibe på satellitbilleder anvendes ofte roterede bounding boxes for at følge skibets orientering.

Hvornår bruges det

Bounding boxes bruges til at annotere datasæt til objektdetektion. Annoterede bounding boxes indgår som ground truth, når en model trænes til at forudsige objekters placering. Modellens output er også bounding boxes med tilhørende klasser.

Kodeeksempel

# Definition af en bounding box som tuple (x_min, y_min, x_max, y_max)
bbox = (50, 100, 200, 300)  # top-left (50,100), bottom-right (200,300)

def compute_area(bbox):
    x_min, y_min, x_max, y_max = bbox
    return (x_max - x_min) * (y_max - y_min)

print(compute_area(bbox))  # Udskriver: 15000

Simpel eksempel på, hvordan en bounding box repræsenteres i Python med pixelkoordinater.

Oprindelse

Fra engelsk 'bounding' (afgrænsende) og 'box' (kasse). Betegnelsen opstod i computer vision i 1990'erne med tidlige detektionssystemer.

Afledte ord

3

Kilder

2
  • Ren, S. et al., Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks, 2015
  • Redmon, J. et al., You Only Look Once: Unified, Real-Time Object Detection, 2016