¥Ñ©ó¤j«¬»y¨¥¼Ò«¬ChatGPT¤µ¦~¨«¬õ¡A¦A«×±È°_¤@ªi¤H¤u´¼¼zÀ³¥Î·¼é¡A°£¤F«P¦¨³\¦h³nÅé»PªA°È¼h±ªº³Ð·s¡A¦UºØ¥i¥[³t¤H¤u´¼¼z³B²zªºµwÅé¹Bºâ§Þ³N¡A¤]¨ü¨ì¦U¬É¼ö¯PÃöª`¡C¦Ó¨¬°¥þ²y¥b¾ÉÅé³]p»P»s³y«Âíªº»OÆW¡A¤£¶È¨ó§U¤j«¬°ê»Ú¯Å¼t°Óµo®i¬ÛÃö¸Ñ¨M¤è®×¡A¤]¥¥¨|¥X¦h®a¥»¤g¼t°Ó¥[¤J³o³õ¥@¬öÄv§½¡C
¦Ó¦b¤µ¦~4¤ëªì¡A¶}©ñ¦¡¤uµ{Áp·ù¡]MLCommons¡^¤½¥¬ªºMLPerf Inference®Ä¯à´ú¸Õ´£³øµ²ªG¤¤¡A´N¦³¤@®a»OÆWAI¥[³t´¹¤ù¼t°Ó¦W¦C¨ä¤¤¡A¨º´N¬O2019¦~¦¨¥ßªº³ÐøÊ´¼¼z¡]Neuchips¡^¡C
¨Æ¹ê¤W¡A¦b2020¦~10¤ëMLCommonsµoªíªºInference Datacenter v0.7®Ä¯à´ú¸Õµ²ªG¡A³ÐøÊ´¼¼z´N¤w´£³ø¡A·í®Éªº¨t²Î²ÕºA±Ä¥ÎFPGA´¹¤ù«¬ºAªºRecAccelì§Î²£«~¡AÂê©w¶}©ñì©l½Xªº²`«×¾Ç²ß±ÀÂ˼ҫ¬¡]Deep Learning Recommendation Model¡ADLRM¡^AIÀ³¥Î±¡¹Ò¡A¦Ó¦b«áÄòªºInference Datacenter v1.0¡B1.1¡B2.0¡A¸Ó¤½¥q´£¥Xªº²£«~¨ü´ú²ÕºA¡A§ï¬°FPGA¥[³tªO¥dTerasic DE-10 Pro¡C
¨ì¤F¤µ¦~4¤ëªº¤½¥¬Inference Datacenter v3.0¡A³ÐøÊ´¼¼z´£¥æ¨â¥÷²£«~®Ä¯à´ú¸Õµ²ªG¡A§¡·f°t¥LÌ¥h¦~5¤ëµoªíªºASIC´¹¤ù¥[³t¥dRecAccel N3000¡A
¨ä¤¤¤@¶µ´ú¸Õ¬O±Ä¥Î³æ±i¥[³t¥dªº°t¸m¡A¨C¬í¥i¶i¦æ107,001¦¸¬d¸ß¡A¥t¤@¶µ´ú¸Õ«h¬OÂX¥R¦Ü8±i¥[³t¥d¡A¨C¬í¥i¶i¦æ856,398¦¸¬d¸ß¡A¨â¬Û¹ï·Ó¤§¤U¡A¬ðÅã³o´Ú²£«~¥iÀH¨Ï¥Î¼Æ¶qªº¼W¥[¡A´£¨Ñªñ100¢H´T«×ªº¹Bºâ®Ä¯à½u©ÊÂX®i¡C
Y°ò©ó¤Wz³o¥÷®Ä¯à´ú¸Õµ²ªG¡A¨Ã¥H¨ä¤¤©Ò¦C³»¯Å¸ê®Æ¤¤¤ßGPU²£«~Nvidia H100ªº¼Æ¾Ú¨Ó¤ñ¸û¡A´NDLRM±ÀÂ˹Bºâ®Ä¯à¦Ó¨¥¡A·f°t8±i³ÐøÊ´¼¼zRecAccel N3000ªºAMD¤G¸ô¡]64®Ö¤ßCPU¡^¦øªA¾¹¡A¥§¡¨C1¥Ë¹q¤O¨C¬í¥i¬d¸ß1060.05¦¸¡]856,398¦¸°£¥H807.88¥Ë¡^¡A·f°t8±iPCIe¤¶±¥d§Î¦¡Nvidia H100ªºAMD¤G¸ô¡]32®Ö¤ßCPU¡^¦øªA¾¹¡A«h¬O633.41¦¸¡]1,501,100¦¸°£¥H2,369.85¥Ë¡^¡A¦]¦¹¡AN3000ªº¨C¥Ë±ÀÂ˹Bºâ®Ä¯à¥i¹F¨ìH100ªº1.7¿¡C³ÐøÊ´¼¼zªí¥Ü¡AY§ï¥Î¥t¤@´Ú¤º«Ø4ÁûRecAccel N3000´¹¤ùªº¥[³t¥d¨Ó¤ñ¸û¡A¥i±æ±N¨C¥Ë±ÀÂ˹Bºâ®Ä¯à»â¥ý´T«×©Ô¤j¡A¹w¦ô¯à¹F¨ìH100ªº2.2¿¡C
RecAccel N3000¬°¦ó·|¦³«G²´ªº¯à·½¨Ï¥Î®Ä²v¡H³ÐøÊ´¼¼z¶È²³æªí¥Ü¡A¦]¬°³o·í¤¤¨Ï¥Î¤FINT8¾ã¼Æ¹Bºâ®Õ·Ç¾¹¡A¦ý¶È¶È¥u¬O³oÓì¦]¶Ü¡H
¦^ÅU¥h¦~¸Ó¤½¥qµoªí³o´Ú¥[³t´¹¤ùªº¬ÛÃö®ø®§·í¤¤¡A§ÚÌ¥i¥H¬Ý¨ìÁÙ¦³¨ä¥L§Þ³NÀu¶Õ¡C¨Ò¦p¡A5¤ë«Å¥¬±À¥XRecAccel N3000®É¡A¥LÌ´£¨ì³o¬O¤@´Úº´Ú±M¬°²`«×¾Ç²ß±ÀÂ˼ҫ¬³B²z¥[³t©Ò³]pªºASIC´¹¤ù¡A¾É¤J¥x¿n¹q7©`¦Ì»sµ{¡A¨Ã±N°ò©ó·f°t³o´Ú´¹¤ùªºÂùM.2¼Ò²Õ²£«~¡A°w¹ï¿í´`¶}©ñ¹Bºâ¥»O¡]OCP¡^³W®æªº¦øªA¾¹¡A´£¨ÑRecAccel N3000 Inference¥»O¡A¥H¤Î±À¥X±Ä¥ÎPCIe 5.0¤¶±ªº¥[³t¥d¡A¥H¦w¸Ë¦b¸ê®Æ¤¤¤ßªº¦øªA¾¹¡C
¦Ó¦bµo®iAIµwÅé¬[ºc»P«ùÄò§ï¨}DLRM¹Bºâ®Ä¯àªº¦P®É¡A¥L̤]¦b³nÅé¼h±¶i¦æ¦@¦P³]p¡A´£¨Ñ¥i¼sªxÀ³¥Îªº³Ì¨Î¤Æ³nÅé°ïÅ|¬[ºc¡A¹ê²{°ªºë·Çªº¹Bºâ¡BµwÅé¸ê·½»P¯à·½§Q¥Î²vªº¥Ø¼Ð¡C
¦bAI±ÀÂ˼ҫ¬ªº³¡¤À¡ARecAccel N3000¤£¶È¤ä´©DLRM¡A¤]¤ä´©WND¡]Wide & Deep¡^¡BDCN¡]Deep and Cross Network¡^¡BNCF¡]Neural Collaborative Filtering¡^¡A¦Ó¦b¦w¥þ©Êªº³¡¤À¡A¥¦¤]¤º«ØµwÅé«H¥ô®Ú¡]RoT¡^¡A¥i±j¤Æ¥»¨ªº«OÅ@¡C
¥Hºë·Ç«×¦Ó¨¥¡A¥L̵o®i¥X¿W¯Sªº8¦ì¤¸¨ó¦P¹Bºâ§Þ³N¡A¥iµ²¦X¶q¤Æ³B²z¡B®Õ·Ç¡BµwÅé¤ä´©¡A±NFP32¹Bºâªººë«×´£¤É¦Ü99.95%¡F´¹¤ù¤º«Ø±MÄݪº¦h¼h·Pª¾¾¹¡]Multilayer Perceptron¡AMLP¡^¹Bºâ¤ÞÀº¡A¯à¦b¤ÞÀº¼h¯Å´£¨Ñ¥ß§Y¥i¹F¨ìªº¯à·½¨Ï¥Î®Ä²v¡A¨Ã¥B¯à¦b¨t²Î³æ´¹¤ù¼h¯Å¡A¹ê²{¨CÓ±À½×³B²z¥u»Ý1²@µJ¦Õ¯à¶qªº²z·Q¡C
¦b°O¾ÐÅ骺¦s¨ú¤è¦¡¤W¡A³ÐøÊ´¼¼z¤]¶}µo¥X±MÄݪº´O¤J¦¡¤ÞÀº¡A¨ã¦³·s«¬§Ö¨ú³]p»PDRAM¬y¶q³Ì¨Î¤Æ¥\¯à¡A¯à°w¹ïLPDDR5°O¾ÐÅé¡A´î¤Ö50¢H¦s¨ú»Ý¨D¡A±N°O¾ÐÅéÀW¼e§Q¥Î²v´£¤É30¢H¡C
¨ì¤F6¤ë¡A³ÐøÊ´¼¼z«Å¥¬RecAccel N3000¶i¤J§ë¤ù¥Í²£¶¥¬q¡A¶i¤@¨B´¦ÅS³o´Ú´¹¤ù²Õ¦¨»P³nÅé°ïÅ|¬[ºc¡C
¥H¹Bºâ¤ÞÀº¦Ó¨¥¡A·í¤¤¤À¦¨´O¤J«¬¤ÞÀº¡B¯S¼x¤¬°Ê¡]Feature-cross¡AFX¡^¤ÞÀº¡A¥H¤Î¯x°}¼ªk¤ÞÀº¡C¨ä¤¤ªº´O¤J«¬¤ÞÀº¡A°w¹ï¥Ø¼Ð¬O¤Wzªº°O¾ÐÅé¦s¨ú®Ä²v¡A¯à¤j´T´î¤Ö´¹¤ù¥H¥~ªº°O¾ÐÅé¦s¨ú»Ý¨D¡F¯S¼x¤¬°Ê¤ÞÀº«h¬O«ü¤ä´©¦hºØAI±ÀÂ˼ҫ¬ªº³B²z¡A¥i²[»\DLRM¡BWND¡BDCN¡BNCF¡F¦Ü©ó¯x°}¼ªk¤ÞÀº¡ARecAccel N3000¤º«Ø10ӰʺA¦h¼h·Pª¾¾¹¹Bºâ¤ÞÀº¡]Dynamic MLP Engine¡^¡A¦Ó¬ÛÃö°t¸m¤]¬O¸`¬Ù¯Ó¹q¶q¡A¥H¤Î¦³®Ä²v³B²z¼eÃP¯x°}¹BºâªºÃöÁä¡C
Ãö©ó³nÅé°ïÅ|¤è±¡A³ÐøÊ´¼¼z´¦ÅS³nÅé¶}µo®M¥ó±N¥]§t½s;¹¡B°õ¦æ®É´Á¤¸¥ó¡A¥H¤Î¤u¨ãÃì¡A¥L̪í¥Ü¡A·í¤¤±N¤ä´©¤j¼Ò«¬¤À³Î¡B¾î¸ó¦hÁû´¹¤ù©Î¥[³t¹Bºâ¥dªº¹Bºâ¤è¦¡¡A¯à¦b¨C¤@Áû´¹¤ù°õ¦æ¦hÓ§ó¤p«¬ªº±À½×³B²z¤u§@¡C
¦Ó¦b¸ê®Æ«¬§Oªº¨Ï¥Î¤W¡A³ÐøÊ´¼¼zµo®i¥X·sªº8¦ì¤¸p¼Æ®æ¦¡¡AºÙ¬°¼u©Ê¯BÂI¡]Flexible Floating Point¡AFFP8¡^¡A¯à«P¨Ï´¹¤ù¹q¸ôÀHµÛAI¼Ò«¬ªº®t²§¦Ó½Õ¾A¡A¥H¦¹¹ê²{°ªºë«×ªº¹Bºâ¡C°£¦¹¤§¥~¡A¥Ñ©óAI°V½m¬Ò±Ä¥Î32¦ì¤¸¡A©Ò¥H¤j®a¯à¨Ï¥Î32¦ì¤¸¨Ó°õ¦æ±À½×³B²z¡AY§ï¥Î8¦ì¤¸¨Ópºâ¡A¯Ó¹q¶q¥iÁY´î¦Ü16¤À¤§1¡A¦ý¹L©¹·~¬ÉÁ`¬O¥²¶·¦bºë·Ç«×»P¹Bºâ®Ä²v¤§¶¡°µ¥X§à¾Ü¡A¥LÌ»{¬°¥i³z¹LFFP8¡A¹ê½î§ó¦hªº¹Bºâºë·Ç«×¡A¤]¯àÝÅU¸`¬ù¯à·½ªº»Ý¨D¡C
¨ì¤F9¤ëªì¡A¦b¹q¤l³]p¦Û°Ê¤Æ¡]EDA¡^¤½¥qSynopsysÁ|¦æªºARC Processor Summit 2022¤j·|´Á¶¡¡A³ÐøÊ´¼¼z¤½¶}§ó¦hRecAccel N3000ªº³W®æ»P§Þ³N¬[ºc²Ó¸`¡A¨Ò¦p¡A´¹²É¤º«Ø160 MBªºSRAM°O¾ÐÅé¡A·f°tªºLPDDR5°O¾ÐÅé¥i°t¸m¬°4Ó32 GB¡B¤º«Ø½u¤W¿ù»~×¥¿³B²z¡]ECC¡^¡APCIe¤¶±¥i¤ä´©3.0¡B4.0¡B5.0¡A³Ì¤j¥i´£¨Ñ16Ó³q¹D¡C
¦Ó¥B¡A¥L̤]ªí©ú·í¤¤±Ä¥ÎSynopsysºX¤Uªº¦h²Õª¿´¹¤ù´¼¼z°]²£¡A¹³¬ORecAccel N3000¤º«Øªº³B²z¾¹·í¤¤¡Aµ²¦X¤FSynopsysªºARC EV72³B²z¾¹¡A§@¬°¼Æ¦ì°T¸¹³B²z¾¹¡]DSP¡^»P¤ä´©¯BÂI¹Bºâ³B²z¡F¦Ó¦b¤¶±¤è±¡A³o¸Ì·f°tSynopsysªº¶i¶¥°ª®Ä¯à¶×¬y±Æ»P©PÃä¶×¬y±Æ¡]AMBA¡^¡BLPDDR5¡BPCIeµ¥´¼¼z°]²£¡F¦b°O¾ÐÅé¤è±¡A·f°tSynopsys Memory Compilers¡A¥iÀò±o¶i¶¥¹q·½ºÞ²z¥\¯à¡FµwÅé¦w¥þ¤è±¡A·f°tSynopsys Hardware Secure Modules¡A¦Ó¯à¨ã³ÆµwÅé«H¥ô®Ú¡A½T«O¨t²Î¶}¾÷µ{¦¡½X¨ü¨ì«OÅ@¡A¤]¯à°õ¦æ¸Ë¸mÅçÃÒ¡C