AI Agent Reliability Tracker

1 points by smartmic 21 days ago · 1 comment

Reader

chrisjj 21 days ago

> recent capability gains have yielded only small improvements in reliability.

Have I missed something? Why would one expect capability gain to make any such improvement?

Settings