Kurumsal AI'da deterministic vs. üretici modeller: hangisi ne zaman?

Kurumsal müşteriler "aynı girdiye aynı çıktıyı" beklediğinde LLM yetmiyor. KDM'de uyguladığımız hibrit mimariyi paylaşıyoruz: deterministic kural motoru + LLM destekli açıklama katmanı.

Sorun: Yöneticinin reproducibility talebi

Bir banka risk komitesi başkanını düşünün. Pazartesi sabahı KDM panelinde "iç denetim uyum skoru: 78" görüyor. Salı toplantısına gidiyor, aynı veriyle skor 81 olarak görünüyor. Kim yeni bilgi ekledi? Hangi kural değişti? Cevap "model her sefer biraz farklı çıktı veriyor olabilir" ise, oradaki güveni kaybettiniz. Yönetim AI'sı için bu kabul edilemez.

Bu yüzden KDM'de (ve aslında her risk/uyum/regülasyon ürünümüzde) iki katmanlı bir mimari uyguluyoruz. Skorun kendisi tamamen deterministic; sadece açıklama metni LLM tarafından üretiliyor. Bu ayırma, müşterinin "aynı girdi, aynı sonuç" talebini karşılarken, raporun okunabilirliğini de korunuyor.

Mimari özeti

  • Katman 1 — Skor motoru: Pure functional Go kodu. Veri girdisi + kural ağırlığı snapshot'ı + hesaplama versiyonu (semver). Aynı üçlü her zaman aynı float64 değeri döner.
  • Katman 2 — Açıklama jeneratörü: Skor + kural breakdown'u → LLM (temperature=0.2, structured output). Çıktı doğal dil + sabit slot şablonu.
  • Katman 3 — Audit log: Her hesaplama için: calculation_run_id, factor_snapshot_hash, template_version, raw_inputs_hash. Geçmiş 7 yıl tutuluyor (KVKK + SPK).

Neden saf LLM yetmedi?

Pilotta saf LLM denedik. Üç problemle karşılaştık:

  1. Reproducibility: Aynı prompt, aynı veri, farklı saat — ufak farklar. Müşteri panelinde fluctuation görmek istemiyor.
  2. Audit trail: Düzenleyici "neden bu skor 78?" diye sorduğunda LLM'in "her şeyi tarttım" cevabı yetersiz. Hangi kuralın hangi ağırlıkta etkilediğini bilmek zorundayız.
  3. Maliyet: 50 binlerce ölçüm/gün için saf LLM ekonomik değil. Deterministic motor mikro-saniyede, LLM saniyelerde çalışıyor.

Pattern: "Numbers from rules, narrative from AI"

Bu paterni şimdi tüm regülasyona-dokunuyor ürünlerimizde kullanıyoruz: U2 Carbon (CBAM hesabı), Adaletopia (İçtihat skoru), AI Finance IQ (KAP filtre skoru). Rakam üretimini AI'a bırakmıyoruz. AI'ı insanlara rakamın hikayesini anlatmak için kullanıyoruz.

Doğru sınır şudur: "Hesabı LLM ile yapma. Hesabı LLM ile açıkla."

Ne zaman saf LLM kullanırız?

Pure üretici modellerin uygun olduğu yerler:

  • İçerik özetleme (haber bültenleri, içtihat özeti)
  • Müşteri destek (FAQ, intent classification)
  • Yaratıcı içerik (pazarlama metni, taslak)

Buralarda "varyasyon" istenen bir özelliktir, sorun değil.

Sonuç

Kurumsal AI ürünü tasarlarken ilk sorduğumuz soru artık şu: "Bu çıktı denetlenecek mi?" Cevap evetse, deterministic katman zorunlu. AI sadece görünür yüzey. Mimariyi bu sırayla kurmak, hem regülatörle hem CFO ile konuşmayı kolaylaştırıyor.