Admin - Mijn Orange v2

Server-status

Lopende proces. Klik "Herstart" om wijzigingen aan server-code (routes, libs) te laden zonder terminal. LaunchAgent com.orange-future.mijn-orange-v2 herstart automatisch na exit.

PID: -

Uptime: -

Gestart: -

LaunchAgent: -

Fresh: -

Eval-dashboard adviesbrief-kwaliteit

Per baseline-run: één scherm met alle KPI's. Gevoed door dashboard_data.json in de run-folder. Genereer per run via make eval-dashboard RUN_DIR=<pad>. Plan: architectuur/plan_evaluatie_dashboard_v1.md.

Run:

Backup project-folder

Periodieke kopie van een bron-folder naar een bestemming (typisch een map in Google Drive). Alleen veranderde bestanden worden gekopieerd (rsync delta). LaunchAgent com.orange-future.backup draait op het ingestelde interval; "Nu draaien" triggert direct.

Backup-status laden...

Bestanden: -

Bytes: -

Interval: -

Bron, bestemming en interval instellen

Bron-folder (absoluut pad): Bestemming-folder (absoluut pad): Interval:

Tip: zet de bestemming binnen je Google Drive-map zodat Drive de cloud-laag verzorgt. Bestemming wordt automatisch aangemaakt bij de eerste run. Wijzig je het interval, dan regenereert de LaunchAgent na herinstallatie via bash mijn_orange_v2/server/install_backup.sh.

Recente runs (laatste 10)

Wanneer	Status	Trigger	Bijgewerkt	Omvang	Duur
nog niet geladen

Spoor A/B-verdeling adviesbrieven

Verdeling tussen norm-vergelijking (spoor A) en eigen-trend (spoor B) in de signaal-alineas van de afgelopen jobs. Doel: richtwaarde 50/50 + harde ondergrens "minstens 1 trend-alinea per brief". Bron: outbox/JOB-*/spoor_meting.json (geschreven sinds Sprint 5, 21 mei 2026). Endpoint: /api/v2/admin/spoor-verdeling.

Afgelopen 14 dagen

Laden...

Maand-metriek

Vier kwaliteitsmetriek over alle adviesbrieven die in de gekozen maand zijn afgeleverd. Drempelloos in de eerste drie maanden van de pilot; deze pagina toont alleen wat er is.

Acceptatie-rate

Aandeel brieven met accountant-akkoord.

Retry-rate

Aandeel brieven dat een auto-retry triggerde.

Brief-aanpassen-rate

Aandeel brieven met accountant-revisie.

Klant-feedback gemiddelde

Gemiddelde sterren-rating uit klant-feedback.

Geladen voor maand: -

Dependency-status

Externe services. Groen = OK, oranje = uitgesteld, rood = probleem of ontbrekend.

Anthropic Laden...

Resend Laden...

n8n Laden...

Feedback-overzicht en download

Live aggregaten uit accountant-rewrites en klant-feedback over het gekozen venster. Download gebruikt het zelfde venster en levert alle entries als JSON voor cross-kantoor-curatie (zie architectuur/versie_b/cowork_prompt_feedback_curatie_v1.md). Plan: architectuur/versie_b/plan_hitl_feedback_loop_v1.md sprint HITL-3.

Venster:

Laden...

C-findings — interne validator-meldingen (audience: internal)

Validator-meldingen die niet aan de accountant getoond worden op review.html (Sprint 4 plan_validator_audience_filter_v1). Blijven volledig draaien; tellingen hieronder helpen prompt-laag-werk te prioriteren. Bron: outbox/JOB-*/judge_verdict.json::deterministic.findings[] gefilterd op AUDIENCE_INTERNAL_CODES.

Klik op Verversen om de tabel te laden.

Silent-fails tweede AI-controle

Aantal jobs in een rolling window waarbij de auto-retry triggerde maar de tweede AI-controle is overgeslagen (silent-fail). Bron: architectuur/versie_b/onderzoek_finding3_auto_retry_pct_v1.md.

Venster: - silent-fails in venster

Geen silent-fails in dit venster.

Pilot-documenten

Twee markdown-documenten voor het kantoor zelf tijdens de pilot-onboarding. Open de link of sla op via uw browser. Deze stukken horen niet in een adviesbrief en gaan niet automatisch naar de klant.

AVG-bijlage voor uw klant · markdown
Korte uitleg voor uw accountantskantoor · markdown

Elke download wordt vastgelegd in admin/audit_log.jsonl onder categorie pilot_doc_download.

Baseline-meting runner

Kwaliteits-meting. Sequentiele run van alle fixtures uit data/eval_demos/ door de interne pipeline. Per fixture worden de hele brief, het oordeel van de AI-controle, het audit-spoor en de signalen bewaard. Elke fixture wordt vergeleken met expected_metrics.json op drempels voor harde bevindingen, AI-controle-gate, brief-lengte en retry-aantal. Drie keer drukken op de hoofdknop levert run_1, run_2, run_3 op in admin/reports/baseline_pre_sprint_a/ voor een spreidings-meting. De dropdown onderaan draait één specifieke fixture in plaats van de hele set; handig voor snelle iteratie na een code-wijziging. Plan: architectuur/versie_b/plan_cijfer_correctheid_doorbraak_v4.md Sprint 0.

Status laden...

Of één fixture:

Nog geen meet-run beschikbaar. Klik op de knop om de eerste run te starten.

Code-omvang en spiraal-meetpunten (NF12)

Anti-spiraal-detector. Per maand: aantal validators of checks, aantal LLM-aanroepen per brief, regels code in mijn_orange_v2/server/, aantal generieke schrijfstijlen. Stille groei is een spiraal-signaal.

Meting	Huidig	Drempel
Aantal controlepunten	4 (1 AI-review + 3 cijfer-checks)	Boven 4
AI-aanroepen per brief	4 (3 productief + 1 talking points)	Boven 4
Aantal generieke schrijfstijlen	2 (zakelijk_formeel + toegankelijk_helder)	Boven 3 in fase 1+2

Anti-spiraal-clausule (zie architectuur/versie_b/anti_spiraal_clausule_v1.md) actief: elke voorgestelde toevoeging passeert eerst de drie vragen voordat hij in de codebase landt.

Health-events & weekoverzicht

Snelle blik op wat er recent fout ging in de pipeline en wat de afgelopen 7 dagen aan brieven door het systeem ging. Event-log wordt automatisch gevuld bij elke pipeline-fout, mislukte AI-review of needs-human-review. Geen mails, alles read-only. Bron: admin/events.jsonl + outbox-aggregaat. Endpoints: /api/v2/admin/health/events en /api/v2/admin/health/digest.

Afgelopen 7 dagen

Laden...

Recente events

Laden...

Groen (alle drempels gehaald)	-
Rood (drempel-overschrijding)	-
Needs human review	-
Datum	-

Admin-overzicht

Server-status

Eval-dashboard adviesbrief-kwaliteit

Per cluster (halluc/brief)

Judge-ankers (NEMACC)

Kwaliteitsflank — overige judge-KPI's

Verhouding trend ↔ benchmark (in brieven)

Auto-correctie-alinea (derde-poging-vangnet)

Detector-vs-judge gap (shadow)

Trend over runs

Cijfer-correctheid recent

Gate-fail recidief (ROOD gate in ≥2 van de getoonde runs)

Anchor-gap recidief (anchor-halluc in ≥2 van de getoonde runs)

Per-fixture overzicht

Backup project-folder

Spoor A/B-verdeling adviesbrieven

Maand-metriek

Dependency-status

Feedback-overzicht en download

C-findings — interne validator-meldingen (audience: internal)

Silent-fails tweede AI-controle

Pilot-documenten

Baseline-meting runner

Code-omvang en spiraal-meetpunten (NF12)

Health-events & weekoverzicht