Server-status
Lopende proces. Klik "Herstart" om wijzigingen aan server-code (routes, libs)
te laden zonder terminal. LaunchAgent com.orange-future.mijn-orange-v2
herstart automatisch na exit.
Eval-dashboard adviesbrief-kwaliteit
Per baseline-run: één scherm met alle KPI's. Gevoed door
dashboard_data.json in de run-folder. Genereer per run via
make eval-dashboard RUN_DIR=<pad>. Plan:
architectuur/plan_evaluatie_dashboard_v1.md.
Backup project-folder
Periodieke kopie van een bron-folder naar een bestemming (typisch een map in Google Drive).
Alleen veranderde bestanden worden gekopieerd (rsync delta). LaunchAgent
com.orange-future.backup draait op het ingestelde interval; "Nu draaien"
triggert direct.
Bron, bestemming en interval instellen
Tip: zet de bestemming binnen je Google Drive-map zodat Drive de cloud-laag verzorgt.
Bestemming wordt automatisch aangemaakt bij de eerste run. Wijzig je het interval, dan
regenereert de LaunchAgent na herinstallatie via bash mijn_orange_v2/server/install_backup.sh.
Recente runs (laatste 10)
| Wanneer | Status | Trigger | Bijgewerkt | Omvang | Duur |
|---|---|---|---|---|---|
| nog niet geladen | |||||
Spoor A/B-verdeling adviesbrieven
Verdeling tussen norm-vergelijking (spoor A) en eigen-trend (spoor B) in
de signaal-alineas van de afgelopen jobs. Doel: richtwaarde 50/50 + harde
ondergrens "minstens 1 trend-alinea per brief". Bron:
outbox/JOB-*/spoor_meting.json (geschreven sinds Sprint 5,
21 mei 2026). Endpoint: /api/v2/admin/spoor-verdeling.
Maand-metriek
Vier kwaliteitsmetriek over alle adviesbrieven die in de gekozen maand zijn afgeleverd. Drempelloos in de eerste drie maanden van de pilot; deze pagina toont alleen wat er is.
Acceptatie-rate
-
Aandeel brieven met accountant-akkoord.
Retry-rate
-
Aandeel brieven dat een auto-retry triggerde.
Brief-aanpassen-rate
-
Aandeel brieven met accountant-revisie.
Klant-feedback gemiddelde
-
Gemiddelde sterren-rating uit klant-feedback.
Geladen voor maand: -
Dependency-status
Externe services. Groen = OK, oranje = uitgesteld, rood = probleem of ontbrekend.
Feedback-overzicht en download
Live aggregaten uit accountant-rewrites en klant-feedback over het gekozen venster.
Download gebruikt het zelfde venster en levert alle entries als JSON voor cross-kantoor-curatie
(zie architectuur/versie_b/cowork_prompt_feedback_curatie_v1.md).
Plan: architectuur/versie_b/plan_hitl_feedback_loop_v1.md sprint HITL-3.
C-findings — interne validator-meldingen (audience: internal)
Validator-meldingen die niet aan de accountant getoond worden op review.html
(Sprint 4 plan_validator_audience_filter_v1). Blijven volledig draaien;
tellingen hieronder helpen prompt-laag-werk te prioriteren.
Bron: outbox/JOB-*/judge_verdict.json::deterministic.findings[] gefilterd op AUDIENCE_INTERNAL_CODES.
| Code | 7 dgn | 30 dgn | Alles | Trend | Verloop 14 dagen |
|---|
Silent-fails tweede AI-controle
Aantal jobs in een rolling window waarbij de auto-retry triggerde maar
de tweede AI-controle is overgeslagen (silent-fail).
Bron: architectuur/versie_b/onderzoek_finding3_auto_retry_pct_v1.md.
Geen silent-fails in dit venster.
Pilot-documenten
Twee markdown-documenten voor het kantoor zelf tijdens de pilot-onboarding. Open de link of sla op via uw browser. Deze stukken horen niet in een adviesbrief en gaan niet automatisch naar de klant.
- AVG-bijlage voor uw klant · markdown
- Korte uitleg voor uw accountantskantoor · markdown
Elke download wordt vastgelegd in admin/audit_log.jsonl
onder categorie pilot_doc_download.
Baseline-meting runner
Kwaliteits-meting. Sequentiele run van alle fixtures uit
data/eval_demos/ door de interne pipeline. Per fixture worden de hele brief,
het oordeel van de AI-controle, het audit-spoor en de signalen bewaard. Elke fixture
wordt vergeleken met expected_metrics.json op drempels voor harde bevindingen,
AI-controle-gate, brief-lengte en retry-aantal. Drie keer drukken op de hoofdknop levert
run_1, run_2, run_3 op in admin/reports/baseline_pre_sprint_a/ voor een
spreidings-meting. De dropdown onderaan draait één specifieke fixture in plaats van de hele
set; handig voor snelle iteratie na een code-wijziging. Plan:
architectuur/versie_b/plan_cijfer_correctheid_doorbraak_v4.md Sprint 0.
Nog geen meet-run beschikbaar. Klik op de knop om de eerste run te starten.
Code-omvang en spiraal-meetpunten (NF12)
Anti-spiraal-detector. Per maand: aantal validators of checks, aantal LLM-aanroepen per brief,
regels code in mijn_orange_v2/server/, aantal generieke schrijfstijlen.
Stille groei is een spiraal-signaal.
| Meting | Huidig | Drempel |
|---|---|---|
| Aantal controlepunten | 4 (1 AI-review + 3 cijfer-checks) | Boven 4 |
| AI-aanroepen per brief | 4 (3 productief + 1 talking points) | Boven 4 |
| Aantal generieke schrijfstijlen | 2 (zakelijk_formeel + toegankelijk_helder) | Boven 3 in fase 1+2 |
Anti-spiraal-clausule (zie architectuur/versie_b/anti_spiraal_clausule_v1.md) actief:
elke voorgestelde toevoeging passeert eerst de drie vragen voordat hij in de codebase landt.
Health-events & weekoverzicht
Snelle blik op wat er recent fout ging in de pipeline en wat de afgelopen
7 dagen aan brieven door het systeem ging. Event-log wordt automatisch
gevuld bij elke pipeline-fout, mislukte AI-review of needs-human-review.
Geen mails, alles read-only.
Bron: admin/events.jsonl + outbox-aggregaat. Endpoints:
/api/v2/admin/health/events en
/api/v2/admin/health/digest.