�@���s���o�����̃T�u�o�b�N���͂��߁A���]�ԑ��s�����A�E�g�h�A�V�[���ȂǑ��ʂȃV�`���G�[�V�����ŗ��p�\�B���험�p���͂��߁A�r�W�l�X�J�W���A���ȒʋX�^�C���Ȃǂɂ����R�ɂȂ��ރf�U�C���ƂȂ��Ă����B
BBC/Paul Pradier
,这一点在51吃瓜中也有详细论述
9. Recursive Tree Traversal
A 组得出了「把握程度:低」(因为明确知道信息存疑),B 组则给出「中」(因为从学者视角出发,分析框架本身是自洽的)。推理模型比非推理模型强的地方在于,至少它还会标注不确定性;但专家身份仍然成功地将这个不确定性从「低」推高到了「中」。
Perform ZQ Calibration [ZQCL]