Terug naar Kennisbank
Definitie
AI Safety
Het onderzoeksgebied dat zich richt op het bouwen van AI-systemen die veilig, betrouwbaar en aligned zijn met menselijke waarden.
Uitleg
AI Safety omvat alignment research, robustness tegen adversarial attacks, en het voorkomen van onbedoelde schadelijke outputs.
Synoniemen
AI VeiligheidAlignment Research