”För resonemangsproblem i verkligheten, hur (modellen) ska bestämma när man ska sluta söka? Vad är belöningsfunktionen? Framgångskriterium? När ska man kalla in verktyg som kodtolkar i loopen? Hur kan man ta hänsyn till beräkningskostnaden för dessa CPU-processer?
Läs mer här
Så fungerar Open AI:s nya o1-modeller
Previous Post
Expert: Osäkert om Northvolt går att rädda