Part V: Evaluation, Reliability, and Governance

Part Overview

Part V focuses on making AI products work reliably. You will master evals, observability, guardrails, cost management, and compliance frameworks.

Interlock with Previous Part

What this part inherits from Part IV:

Reference architectures (Ch 15) become the eval substrate: each pattern needs specific reliability tests
Model routing and capability allocation (Ch 16) require eval-driven quality verification
Retrieval and knowledge systems (Ch 17) need continuous accuracy monitoring
Security concerns (Ch 20) become guardrail requirements

What this part changes retroactively:

Engineering decisions get evaluated for reliability impact: some architectures are harder to eval
Vibe-coding quality bar (Part III) gets replaced with explicit reliability metrics

Artifacts that now need updating:

Ch 21 Evals as the Core Development Discipline

LLM-as-Judge, eval pipelines, eval-driven development.

Ch 22 Observability, Debugging, and Failure Analysis

Tracing, debugging AI failures, failure mode analysis.

Ch 23 Reliability, Guardrails, and Recovery

Guardrails, circuit breakers, graceful degradation.

Ch 24 Cost, Latency, and Unit Economics

Cost optimization, latency management, unit economics.

Ch 25 Governance, Compliance, and Trustworthy AI

NIST AI RMF, ISO 42001, EU AI Act, bias detection.

Bridge Notes

Earlier artifacts updated by this part:

Later chapters this part prepares for:

Part VI, Ch 26-30: Launch criteria, SLAs, and compliance are built on eval foundations
Part VII, Ch 31-33: The capstone uses evals as the quality language throughout