×÷ÕߣüAGµçͶÌü¿Æ¼¼Ñз¢ÖÐÐÄ
ÎÄÕµ¼¶Á£º
±¾ÎÄ´ÓÒøÐн¹µãϵͳ AI תÐ͵ÄÌôÕ½³ö·¢£¬·ÖÏíÁËAGµçͶÌü¿Æ¼¼»ùÓÚÒøÐн¹µãϵͳ¶àÄêÂÄÀú»ýµí¸ø³öµÄÆÆ¾Ö˼Ð÷£¬Ìá³öÔÚ¡°N+M¡±´óÄ£×ÓÐͬսÂÔÖ§³ÖÏÂ̽Ë÷ÈË»úÐ×÷з¶Ê½µÄ½¥½øÊ½Â·¾¶£¬²¢Õ¹Ê¾ÁËÔÚ DeepSeek-R1 ¼Ó³ÖÏ£¬ÖÇÄÜ»¯ÐèÇóÆÊÎö³¡¾°ÖеÄÊÖÒÕʵ¼ù½×¶ÎЧ¹û¡£Î´À´£¬AGµçͶÌü¿Æ¼¼½«´ÓÉÖÇÄÜÌåÐ×÷ºÍÍØ¿í¶à³¡¾°Ó¦ÓÃÁ½·½ÃæÈëÊÖ£¬´òÔìÒøÐÐÖÇÄÜ»¯½¹µãϵͳÑз¢Ð·¶Ê½¡£
01
н¹µãÌôÕ½
ÔÚ½ðÈÚÒµÖÇÄÜ»¯Àå¸ïµÄÁÙ½çµãÉÏ£¬ÒøÐн¹µãϵͳÕýÂÄÀú´Ó"¹¦Ð§ÒýÇæ"Ïò"ÈÏÖªÖÐÊà"µÄÖʱ䡣ÓÈÆäÊǽüÁ½Ä꣬´óÄ£×ÓÊÖÒÕµÄѸÃÍÉú³¤£¬Ò»Ö±ÖØËÜÐÐÒµ¶Ô AI Â䵨µÄÏëÏó¿Õ¼ä£¬ÎªÒøÐн¹µãϵͳµÄÖÇÄÜ»¯×ªÐÍ´øÀ´ÐµĿÉÄÜÐÔ¡£
È»¶ø£¬ÒøÐн¹µãϵͳ×÷ÎªÒøÐÐµÄ ¡°´óÄÔ¡± ºÍ ¡°ÐÄÔࡱ£¬ÔÚ׼ȷÐÔ¡¢¸ß¿ÉÓÃÐÔÒÔ¼°ºÏ¹æÐÔ·½ÃæÓÐ׿«ÎªÑÏ¿ÁµÄÒªÇó£¬Ê¹´óÄ£×ÓÊÖÒÕÔÚÒøÐн¹µãϵͳÖеÄÓ¦ÓÃÃæÁÙÖî¶àÌôÕ½¡£Ö÷ÒªÎÊÌ⼯ÖÐÔÚ£º
1¡¢Í¨ÓÃ֪ʶרҵÐÔ¾ÖÏÞ£ºÍ¨ÓôóÄ£×Óȱ·¦ÒøÐн¹µãϽµµÍìÓòµÄרҵӪҵ֪ʶ£¬ÃæÁÙ½¹µãÏµÍ³ÖØ´óµÄרҵ³¡¾°ÐèÇóʱ£¬Ð§¹ûͨ³£È±·¦Ô¤ÆÚ¡£
2¡¢´óÄ£×ÓÂ䵨Ŀ¾³£º´óÄ£×Ó°²ÅźÍÔËÐÐËùÒÀÀµµÄ¸ßËãÁ¦×ÊÔ´£¬ÒÔ¼°Ä£×Óµ÷ÓŵÄרҵ¶ÈÒªÇó£¬ÔöÌíÁËÂ䵨ÄѶȡ£
3¡¢ÖØ´óϵͳµÄ¿çÓòÐͬÌôÕ½£ºÒøÐÐIT¼Ü¹¹Öش󣬽¹µãϵͳÍùÍùÐèÒª¸úÉϰٸöÍâΧϵͳ½»»¥£¬¶Ô´óÄ£×ÓÄÜÁ¦Ìá³öÑÏËàÌôÕ½¡£
Õë¶ÔÕâЩÎÊÌ⣬AGµçͶÌü¿Æ¼¼Ìá³öÒÔÏÂÆÆ¾Ö˼Ð÷£º¹¹½¨"N+M"´óÄ£×ÓÐͬսÂÔ£¬Í¨¹ýN¸öͨÓôóÄ£×ÓÓëM¸ö³¡¾°Ð¡Ä£×ÓµÄÓлú×éºÏ£¬ÖÜÈ«ÌáÉý½ðÈÚÁìÓòµÄ´óÄ£×ÓÓ¦ÓÃЧ¹û£¬ÍØ¿í´óÄ£×ÓÓ¦Óó¡¾°¡£
¡°N¡±£º¾«Ñ¡ÊÊÅäÒøÐн¹µã³¡¾°µÄͨÓôóÄ£×Ó
»ùÓÚAGµçͶÌü¿Æ¼¼ÉîÈëµÄͨÓôóÄ£×ÓÄÜÁ¦ÆÀ¹ÀºÍÊÊÓÃÐÔÑо¿£¬Õë¶ÔÒøÐн¹µãϵͳ AI ¸³Äܳ¡¾°µÄÏêϸÐèÇó£¬ÕçѡͨÓôóÄ£×Ó×éºÏ£¬ÊµÏÖ¼ÛÖµ¿ìËÙÂ䵨¡£
¡°M¡±£º¹¹½¨×¨Òµ³¡¾°Ð¡Ä£×Ó
¾Û½¹ÒøÐн¹µãÓªÒµ¸ß¼ÛÖµ¸ßÖØ´óµÄϸ·Ö³¡¾°£¬Éî¶ÈÈÚºÏAGµçͶÌü¿Æ¼¼½¹µã²úƷ֪ʶºÍÐÐÒµ×î¼Ñʵ¼ù£¬´òÔìÇáÁ¿¼¶µÄ³¡¾°Ð¡Ä£×Ó¡£
ÕâÖÖÁ¢ÒìµÄ¡°N+M¡±´óÄ£×ÓÐͬսÂÔ£¬¿ÉÒÔÆ¾Ö¤Ê¹ÃüÌØÕ÷ÎÞаÊÊÅ䣬ͨ¹ý´óÄ£×Ó¡¢Ð¡Ä£×ÓÉõÖÁ¹Å°å AI ÊÖÒÕµÄÎÞа×éºÏ£¬ÓÐÓÃʵÏÖ½¹µãÏµÍ³ÖØ´ó³¡¾°µÄÖÇÄÜ»¯×÷Òµ£¬Ìá¸ß Al Agent Êä³öЧ¹ûµÄ׼ȷÐԺͿɿ¿ÐÔ£¬´Ó¶ø¾«×¼Öª×ãÒøÐн¹µãÁìÓò AI ¸³ÄܵÄÉî¶ÈÓ¦ÓÃÐèÇ󣬼ÓËÙ¼ÛÖµÂ䵨¡£
02
з¶Ê½Ì½Ë÷
»ùÓÚ¡°N+M¡±´óÄ£×ÓÐͬսÂÔµÄÆÆ¾Ö˼Ð÷£¬AGµçͶÌü¿Æ¼¼ÒÔ´òÔìÒøÐÐÖÇÄܽ¹µãÒ»Ì廯¼Æ»®ÎªÄ¿µÄ£¬Öƶ©ÁËÈý½×¶ÎÑз¢ÍýÏ룺
Ä£×ÓÊÔË®£ºÑé֤ͨÓôóÄ£×Ó£¬Ì½Ë÷³¡¾°Ð¡Ä£×Ó
? Ä¿µÄ£ºÌ½Ë÷ͨÓôóÄ£×ÓÔÚ²î±ð³¡¾°ÏµÄÄÜÁ¦½çÏߺÍÊÊÓÃÐÔ¡£
? Õ½ÂÔ£ºÑ¡Ôñ¶à¸öͨÓôóÄ£×Ó¿ìËÙÑéÖ¤ÆäÔ×ÓÄÜÁ¦£¬Õë¶ÔÌØ¶¨³¡¾°ÊµÑé΢µ÷³¡¾°Ð¡Ä£×Ó¾ÙÐÐÔöÇ¿£¬±£´æÒªº¦ÄÜÁ¦£¬½µµÍ°²ÅÅÃż÷¡£
? ʵ¼ù£º´ÓÁìÓò֪ʶÎÊ´ð¡¢ÎĵµÐÞ¶©µÈ³¡¾°ÈëÊÖ£¬½ÓÄÉ Copilot ģʽ¿ìËÙÑé֤֪ʶ¼ìË÷¡¢½á¹¹»¯Îı¾ºÍ´úÂëÌìÉúµÈÔ×ÓÄÜÁ¦£¬Îª¹¹½¨ÁìÓòר¼ÒÖÇÄÜÌåÌṩÐëÒªÌõ¼þ¡£
ÁìÓòÉî¸û£º¹¹½¨ÁìÓòר¼ÒÖÇÄÜÌ壬×ÔÖ÷Íê³ÉʹÃü
? Ä¿µÄ£º¹¹½¨×¨¼ÒÖÇÄÜÌ壬Ñé֤ģ×Ó·Ö¹¤×éºÏÕ½ÂÔ¡£
? Õ½ÂÔ£ºÆ¾Ö¤²î±ð³¡¾°ºÍ´óÄ£×ÓÄÜÁ¦ÌØÕ÷£¬Éè¼ÆÄ£×Ó·Ö¹¤Õ½ÂÔ£¬Èç DeepSeek-R1+DeepSeek-V3 ×éºÏ£¬»®·ÖÈÏÕæÍÆÀíÍýÏëºÍÖ´ÐС£Í¨¹ý΢е÷֪ʶÕôÁóµÈÊÖÒÕ£¬½øÒ»²½ÌáÉý³¡¾°Ð¡Ä£×ÓÖ´ÐÐרÏîʹÃüµÄÄÜÁ¦¡£
? ʵ¼ù£ºÖع¹ÐèÇó¡¢Éè¼Æ¡¢¿ª·¢¡¢²âÊԶ˵½¶ËÊÂÇéÁ÷£¬´òÔì AutoBA¡¢AutoDesign¡¢AutoTest µÈÁìÓòר¼ÒÖÇÄÜÌ壬¼´ÄÜ×ÔÖ÷Íê³É¸÷ÁìÓòÊÂÇéʹÃü£¬Ò²ÄÜÓëר¼ÒÖ°Ô±Ð×÷Íê³É±ÊÖ±ÁìÓòÖØ´óʹÃü¡£
Éú̬¹¹½¨£º´Ó AI4SE µ½ AI4Biz£¬´òÔìÒøÐÐÖÇÄܽ¹µãÒ»Ì廯¼Æ»®
? Ä¿µÄ£º¹¹½¨¶àÖÇÄÜÌåÐ×÷Éú̬£¬´òÔìÖÇÄÜ»¯½¹µãϵͳ¡£
? Õ½ÂÔ£ºÍêÉÆ¡°N+M¡±´óÄ£×Óϵͳ£¬¹¹½¨È«³¡¾°¶àÖÇÄÜÌåÐ×÷Éú̬£¬´òÔìÒøÐÐÖÇÄÜ»¯½¹µãϵͳÑз¢Ð·¶Ê½¡£
? ʵ¼ù£ºÂòÍ¨ÒøÐн¹µãϵͳÑз¢È«Á´Â·£¬ÓÅ»¯ÈË»úÐ×÷ģʽ£¬ÖÜÈ«ÌáÉýÖØ´óʹÃüÖ´ÐÐЧÂʺÍÖÊÁ¿¡£
03
ÐÂÊÖÒÕʵ¼ù
AGµçͶÌü¿Æ¼¼´ÓÒøÐн¹µãϵͳÑз¢³¡¾°ºÍ²¿·ÖÓªÒµ³¡¾°ÈëÊÖ£¬ÂÊÏÈÍê³ÉÁ˵ÚÒ»½×¶ÎͨÓôóÄ£×ÓÄÜÁ¦ÑéÖ¤µÄÄ¿µÄ£¬ÏÖÔÚÒÑÂõÈëµÚ¶þ½×¶Î£¬Õý¾Û½¹ÒøÐн¹µãϵͳÖÇÄÜ»¯Ñз¢ÌáЧ£¬¹¹½¨ AutoBA¡¢AutoDesign¡¢AutoTest µÈ¶à¸öÁìÓòר¼ÒÖÇÄÜÌ壬ÕâЩÖÇÄÜÌ彫ÁýÕÖ½Ó¿Ú²î±ðÆÊÎö¡¢ÐèÇóÎÊ´ð¡¢´úÂë½â¶Á¡¢²âÊÔ°¸ÀýµÈ¶à¸ö³¡¾°¡£
DeepSeek-R1 µÄ·ºÆð£¬ÎÞÒÉΪAGµçͶÌü¿Æ¼¼µÄÊÖÒÕʵ¼ùÀú³Ì°´ÏÂÁ˼ÓËÙ¼ü¡£ÏÂÎĽ«ÒÔÐèÇóÆÊÎöÖÇÄÜÌåAutoBAΪÀý£¬Ïò¸÷ÈËÏÈÈÝAGµçͶÌü¿Æ¼¼µÄÊÖÒÕʵ¼ùЧ¹û¡£
AutoBA ÏÈÈÝ
ÐèÇóÆÊÎöÖÇÄÜÌåAutoBA£¬ÓëAGµçͶÌü¿Æ¼¼ÐèÇóÆÊÎöƽ̨Âòͨ£¬ÊµÏÖÖÇÄܸÐ֪ʹÃü³¡¾°¡¢ÌáÈ¡¹ØÁª×ʲú¡¢Å²ÓÃÐèÇóÆÊÎö¹¤¾ß¡¢¶à½ÇÉ«AgentsÐ×÷ºÍ½»»¥Ê½ÈË»úÐ×÷·´Ï죬ּÔÚΪ½¹µãϵͳÐèÇóÆÊÎöÈ«³¡¾°¸³ÄÜ¡£
AutoBA ÊÂÇéʹÃüʾÀý
ʹÃü1£ºÕÒµ½Òª¸Ä¶¯µÄÐèÇó²î±ðµã£¨Âú·Ö10·Ö£¬ÆÚÍû·ÖÊý¡Ý8·Ö£©
- »ù´¡ÆÀ·Ö£ºÆ¾Ö¤Îĵµ¸Ä¶¯µãÊýĿƽ¾ù·ÖÅÉ»ù´¡·ÖÖµ
- ¿Û·ÖÏ¹ýʧʶ±ð£¨-2·Ö/´¦£©£¬ÎÞЧÐ޸ģ¨-1·Ö/´¦£©
- ¼Ó·ÖÏʶ±ð³ö±ê×¼ÃÕµ×¹æÄ£ÍâµÄÓÐÓÃÄÚÈÝ£¨+2·Ö/´¦£©
ʹÃü2£º×¼È·ÌìÉúÐèÇóÐÞ¸ÄÖ¸ÁÂú·Ö6·Ö£¬ÆÚÍû·ÖÊý¡Ý5·Ö£©
- ÌìÉú׼ȷµÄÖ¸Á1·Ö£©
- ׼ȷÕÒµ½Ä¿µÄÎļþ£¨1·Ö£©
- ׼ȷ¶¨Î»ÐÞ¸ÄλÖã¨1·Ö£©
- ×ö³öÁË׼ȷµÄ²Ù×÷£¨1·Ö£©
×ÜÌåÆÀ¼Û
- ÕûÌå׼ȷÂÊ60%ÒÔÉÏ£¨1·Ö£©
- Ö¸ÁîÍêȫ׼ȷ£¨2·Ö£©
AutoBA Ч¹ûչʾ
1. AutoBA×ÔÁ¦Íê³ÉÐèÇó²î±ðÆÊÎö
a. ʹÃüÍýÏ룺AutoBA ÖÆ¶©ÁËÆÊÎöÍýÏ룬¿É¸ú×ÙÏêϸʹÃüÖ´ÐÐ
b. Éî¶ÈÍÆÀí£ºÍ¨¹ý¼ìË÷ÐèÇóÎĵµ£¬ÆÊÎöϵͳÏÖ×´ÆÊÎö£¬Ê¶±ðÐèÇó²î±ð£¬²¢¸ø³ö½â¾ö¼Æ»®½¨Òé
c. Ð޸IJÙ×÷£ºÌìÉúÐÞ¸ÄÖ¸Á¶Ôʶ±ðµ½ÓÐÐèÇó²î±ðµÄÐèÇóÎĵµ¾ÙÐÐÕë¶ÔÐÔÄÚÈÝÐÞ¸Ä
2. ÈË»úÐ×÷½»»¥Ê½·´Ïì
a. ÖÇÄܱê×¢£º»ùÓÚ¶ÔÐèÇó±ä»»ÄÚÈݵÄÃ÷È·£¬AutoBA ×Ô¶¯Íê³ÉÐèÇó¸Äд£¬²¢ÔÚÐèÇóÎĵµÖÐÒÔÉ«¿éÐÎʽ±ê×¢ÐÞ¸ÄÄÚÈÝ
b. ¿ìËÙ¾öÒ飺Ìṩ"½ÓÊÜÐÞ¸Ä"ºÍ"¾Ü¾øÐÞ¸Ä"µÄ°´Å¥£¬Àû±ãÓû§¿ìËÙ¾öÒé
AutoBA Ч¹ûÆÀ²â
AGµçͶÌü¿Æ¼¼Ñ¡È¡ÁË DeepSeek-R1¡¢DeepSeek-R1-Distill-Qwen-32BºÍQwen2.5-32B-Instruct Èý¸öºòѡģ×Ó×÷Ϊ AutoBA µÄµ×²ãÖ§³Ö£¬Ö¼ÔÚ¸üºÃµÄʵÏÖ´óÄ£×ÓÔÚÖØ´óÐèÇóÆÊÎö³¡¾°µÄÓ¦ÓÃЧ¹û¡£
ÆÀ²âЧ¹ûÆÊÎö£º
? ÒýÈë DeepSeek-R1 ºó£¬ÖÇÄÜÌåµÄÉî¶È˼Ë÷ÄÜÁ¦ºÍÍÆÀíÄÜÁ¦»ñµÃÌáÉý£¬Ê¹ AutoBA ÔÚ½¹µãϵͳÐèÇóÆÊÎöÀú³ÌÖУ¬²»µ«ÄܸüÇåÎúµØÕ¹Ê¾ÆÊÎöµÄ˼Ë÷Àú³Ì£¬»¹ÄÜÌáÉýÆÊÎöÖÊÁ¿£¬¸¨ÖúBA¸ü¸ßЧµØÍê³ÉÐèÇóÆÊÎöÊÂÇé¡£
? DeepSeek-R1 ÍÆÀíÄÜÁ¦¿Éͨ¹ý֪ʶÕôÁó·½·¨Ç¨áãÖÁС³ß´çÄ£×ÓÉÏ£¨ÈçÉϱí DeepSeek-R1-Distill-Qwen-32B£©£¬Ö¤ÊµÎúÔöǿС³ß´çÄ£×ÓÍÆÀíÄÜÁ¦¡¢Ë¼Ë÷ÄÜÁ¦ÒÔÖª×ã AutoBA ³¡¾°ÐèÇóµÄ¿ÉÐÐÐÔ¡£
04
г¡¾°Õ¹Íû
δÀ´£¬ÔÚ´óÄ£×Óϵͳ¹¹½¨µÄÀú³ÌÖУ¬AGµçͶÌü¿Æ¼¼½«Ò»Á¬¾Û½¹ÒøÐн¹µãϵͳÑз¢Öش󳡾°£¬ÒÀ¾Ý¶àÖÇÄÜÌå¿çÁìÓòÐ×÷ÓÅ»¯Ä£×Ó·Ö¹¤Õ½ÂÔ£¬ÖصãÔöÇ¿ÖÖÖÖÐ×÷³¡¾°Ð¡Ä£×ÓµÄÄÜÁ¦£¬´Ó¶øÖÜÈ«ÌáÉýÖØ´óʹÃüÖ´ÐÐЧÂʺÍÖÊÁ¿£¬½øÒ»²½½µµÍ°²ÅÅÃż÷¡£Í¬Ê±£¬AGµçͶÌü¿Æ¼¼½«ÍŽá¶àÖÖÈË»úÐ×÷ģʽ½¨ÉèÒ»Á¬Ñ§Ï°»úÖÆ£¬Ê¹³¡¾°Ó¦ÓÃÖб¬·¢µÄÐÂ֪ʶһֱ·´Ï쵽ģ×ÓѵÁ·ÖУ¬ÐγÉ֪ʶ»ýÀÛµÄÁ¼ÐÔÑ»·¡£
ÔÚÓ¦Óó¡¾°µÄÍØÕ¹²ãÃæ£¬AGµçͶÌü¿Æ¼¼ÔÚ¼ÌÐø¸»ºñÈí¼þ¹¤³ÌÈ«³¡¾°ÖÇÄÜÌåÉú̬µÄͬʱ£¬»¹½«ÍŽá×ÔÉíÔÚ½¹µãϵͳӪҵ½¨Ä£¡¢ÊµÑ鹤ÒÕµÈÁìÓò³ÁµíµÄר¼ÒÂÄÀúºÍÊý×Ö×ʲú£¬Íƶ¯ ¡°N+M´óÄ£×ÓÐͬսÂÔ¡± µÄÊÖÒÕºÍÓ¦ÓÃ×î¼Ñʵ¼ù£¬´ÓÈí¼þ¹¤³ÌÁìÓòÏòÒøÐн¹µãϵͳ¸ü¶àÓªÒµ³¡¾°Ç¨á㣬×îÖÕ´òÄ¥ÐγÉÎªÒøÐÐÒµÊý×Ö»¯×ªÐ͸³ÄÜµÄ AI4Biz Ò»Ì廯½â¾ö¼Æ»®£¬ÖúÁ¦ÒøÐÐÂõÈëÔ½·¢ÖÇÄÜ¡¢¸ßЧ¡¢ÎÞаµÄÐÂʱ´ú¡£
²Î¿¼×ÊÁÏ£º
1.ÖйúÐÅϢͨѶÑо¿ÔºÈ˹¤ÖÇÄÜÑо¿Ëù, & »ªÎªÔÆÅÌËãÊÖÒÕÓÐÏÞ¹«Ë¾. (2024.9). ÖÇÄÜ»¯Èí¼þ¿ª·¢ÂäµØÊµ¼ùÖ¸ÄÏ.
http://www.caict.ac.cn/kxyj/qwfb/ztbg/202409/t20240919_493348.htm?S0OMlgNm0r2m=1740013164777
2. DeepSeek-AI. DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning. URL
https://arxiv.org/pdf/2501.12948
3. Sail-sg. There May Not be Aha Moment in R1-Zero-like Training ¡ª A Pilot Study. URL
https://github.com/sail-sg/oat-zero
4. Zichen Liu*, Changyu Chen*, Wenjun Li*, Tianyu Pang, Chao Du, Min Lin. There May Not be Aha Moment in R1-Zero-like Training ¡ª A Pilot Study. URL
https://oatllm.notion.site/oat-zero#192dba9c0091817491e3fc3a217ee7ea
5. YueWang?,1,2 ,QiuzhiLiu?,1 ,JiahaoXu?,1 ,TianLiang?,1 ,XingyuChen?,1,3 ,ZhiweiHe?,1,3 , LinfengSong1 ,DianYu1 ,JuntaoLi2 ,ZhuoshengZhang3 ,RuiWang2 , ZhaopengTu?1 ,HaitaoMi1 ,andDongYu1. Thoughts Are All Over the Place: On the Underthinking of o1-Like LLMs. URL
https://arxiv.org/pdf/2501.18585
6. Niklas Muennighoff*134 Zitong Yang*1 Weijia Shi*2 Xiang Lisa Li*1 Li Fei-Fei1 Hannaneh Hajishirzi23 Luke Zettlemoyer2 Percy Liang1 Emmanuel Cand¨¨s1 Tatsunori Hashimoto1. s1: Simple test-time scaling. URL
https://arxiv.org/pdf/2501.19393