***
רҵ×ÊÁÏÕûÀí·ÖÏí
3¡¢ÃÀ¹ú¼ÓÖÝ´óѧ²®¿ËÀû·ÖУÌá³öµÄÊý¾Ý·ÖÎöµÄÈí¼þÕ» ´¦Àí¿ÉÒÔ·ÖΪÄÄÈý¸öÀàÐÍ£¿
´ð£º¢Ù¸´ÔÓµÄÅúÁ¿Êý¾Ý´¦Àí£ºÊ±¼ä¿ç¶Èͨ³£ÔÚÊýÊ®·ÖÖÓµ½ÊýСʱ֮¼ä£» ¢Ú»ùÓÚÀúÊ·Êý¾ÝµÄ½»»¥Ê½²éѯ£ºÊ±¼ä¿ç¶Èͨ³£ÔÚÊýÊ®Ãëµ½Êý·ÖÖÓÖ®¼ä£» ¢Û»ùÓÚʵʱÊý¾ÝÁ÷µÄÊý¾Ý´¦Àí£ºÊ±¼ä¿ç¶Èͨ³£ÔÚÊý°ÙºÁÃëµ½ÊýÃëÖ®¼ä¡£
BDASÈÏΪĿǰµÄ´óÊý¾Ý
4¡¢Spark ÒÑ´òÔì³ö½á¹¹Ò»Ì廯£¬¹¦ÄܶàÑù»¯µÄ´óÊý¾ÝÉú̬ϵͳ£¬ÊÔÊö Éú̬ϵͳ¡£
Spark µÄ
´ð£ºSpark µÄÉè¼Æ×ñÑ¡°Ò»¸öÈí¼þÕ»Âú×㲻ͬӦÓó¡¾°¡±µÄÀíÄÖð½¥ÐγÉÒ»Ì× ÍêÕûÉú̬ϵͳ£¬ ¼ÈÄܹ»ÌṩÄÚ´æ¼ÆËã¿ò¼Ü£¬ Ò²¿ÉÒÔÖ§³Ö SQL¼´Ï¯²éѯ¡¢ ʵʱÁ÷ʽ ¼ÆËã¡¢»úÆ÷ѧϰºÍͼ¼ÆËãµÈ¡£ Spark ¿ÉÒÔ²¿ÊðÔÚ×ÊÔ´¹ÜÀíÆ÷ YARNÖ®ÉÏ£¬Ìṩһ վʽµÄ´óÊý¾Ý½â¾ö·½°¸¡£Òò´Ë£¬ Spark ËùÌṩµÄÉú̬ϵͳͬʱ֧³ÖÅú´¦Àí¡¢½»»¥ ʽ²éѯºÍÁ÷Êý¾Ý´¦Àí¡£
5¡¢´Ó Hadoop+Storm¼Ü¹¹×ªÏò Spark ¼Ü¹¹¿É´øÀ´ÄÄЩºÃ´¦£¿ ´ð£º£¨1£©ÊµÏÖÒ»¼üʽ°²×°ºÍÅäÖá¢Ï̼߳¶±ðµÄÈÎÎñ¼à¿ØºÍ¸æ¾¯£» £¨2£©½µµÍÓ²¼þ¼¯Èº¡¢Èí¼þά»¤¡¢ÈÎÎñ¼à¿ØºÍÓ¦Óÿª·¢µÄÄѶȣ» £¨3£©±ãÓÚ×ö³ÉͳһµÄÓ²¼þ¡¢¼ÆËãÆ½Ì¨×ÊÔ´³Ø¡£
6¡¢ÊÔÊö¡°Spark on YARN¡±µÄ¸ÅÄî¡£
´ð£ºSpark ¿ÉÒÔÔËÐÐÓë YARNÖ®ÉÏ£¬Óë Hadoop½øÐÐͳһ²¿Ê𣬠¼´¡°Spark onYARN¡±£¬ Æä¼Ü¹¹ÈçͼËùʾ£¬×ÊÔ´¹ÜÀíºÍµ÷¶ÈÒÔÀ´
YARN£¬·Ö²¼Ê½´æ´¢ÔòÒÔÀ´ HDFS¡£
ÍêÃÀ WORD¸ñʽ±à¼
***
***
רҵ×ÊÁÏÕûÀí·ÖÏí
7¡¢ÊÔÊöÈçÏ Spark µÄ¼¸¸öÖ÷Òª¸ÅÄ RDD¡¢DAG¡¢½×¶Î¡¢·ÖÇø¡¢ÕÒÀÀµ¡¢¿íÒÀÀµ¡£ ´ð£º¢ÙRDD£ºÊǵ¯ÐÔ·Ö²¼Ê½Êý¾Ý¼¯£¨ Resilient
Distributed
Dataset £©µÄÓ¢ÎÄËõ
д£¬ÊÇ·Ö²¼Ê½ÄÚ´æµÄÒ»¸ö³éÏó¸ÅÄÌṩÁËÒ»Öָ߶ÈÊÜÏ޵Ĺ²ÏíÄÚ´æÄ£ÐÍ¡£ ¢ÚDAG£ºÊÇ Directed Acyclic Graph µÄÒÀÀµ¹ØÏµ¡£
¢Û½×¶Î£ºÊÇ×÷ÒµµÄ»ù±¾µ÷¶Èµ¥Î»£¬ Ò»¸ö×÷Òµ»á·ÖΪ¶à×éÈÎÎñ£¬ ÿ×éÈÎÎñ±»³ÆÎª ¡°½× ¶Î¡±£¬»òÕßÒ²±»³ÆÎª¡°ÈÎÎñ¼¯¡±¡£
¢Ü·ÖÇø£ºÒ»¸ö RDD¾ÍÊÇÒ»¸ö·Ö²¼Ê½¶ÔÏ󼯺ϣ¬ ±¾ÖÊÉÏÊÇÒ»¸öÖ»¶ÁµÄ·ÖÇø¼Ç¼¼¯ºÏ£¬ ÿ¸ö RDD¿ÉÒԷֳɶà¸ö·ÖÇø£¬Ã¿¸ö·ÖÇø¾ÍÊÇÒ»¸öÊý¾Ý¼¯Æ¬¶Î¡£
¢ÝÕÒÀÀµ£º¸¸ RDDµÄÒ»¸ö·ÖÇøÖ»±»Ò»¸ö×Ó RDDµÄÒ»¸ö·ÖÇøËùʹÓþÍÊÇÕÒÀÀµ¡£
£¨ÓÐÏòÎÞ»·Í¼£©µÄÓ¢ÎÄËõд£¬·´Ó³ RDDÖ®¼ä
ÍêÃÀ WORD¸ñʽ±à¼
***
***
רҵ×ÊÁÏÕûÀí·ÖÏí
¢Þ¿íÒÀÀµ£º¸¸ RDDµÄÒ»¸ö·ÖÇø±»Ò»¸ö×Ó RDDµÄ¶à¸ö·ÖÇøËùʹÓþÍÊÇ¿íÒÀÀµ¡£
8¡¢Spark ¶Ô RDDµÄ²Ù×÷Ö÷Òª·ÖΪÐж¯£¨ Action £©ºÍת»»£¨ Transformation £©Á½ ÖÖÀàÐÍ£¬Á½ÖÖÀàÐͲÙ×÷µÄÇø±ðÊÇʲô£¿
´ð£ºÐж¯£¨ Action £©£ºÔÚÊý¾Ý¼¯ÉϽøÐÐÔËË㣬·µ»Ø¼ÆËãÖµ¡£
ת»»£¨Transformation £©£º»ùÓÚÏÖÓеÄÊý¾Ý¼¯´´½¨Ò»¸öеÄÊý¾Ý¼¯¡£
µÚÊ®ÕÂ
1 ÊÔÊöÁ÷Êý¾ÝµÄ¸ÅÄî
Á÷Êý¾Ý£¬¼´Êý¾ÝÒÔ´óÁ¿¡¢¿ìËÙ¡¢Ê±±äµÄÁ÷ÐÎʽ³ÖÐøµ½´ï
2 ÊÔÊöÁ÷Êý¾ÝµÄÌØµã
Á÷Êý¾Ý¾ßÓÐÈçÏÂÌØÕ÷£º
Êý¾Ý¿ìËÙ³ÖÐøµ½´ï£¬Ç±ÔÚ´óСҲÐíÊÇÎÞÇîÎÞ¾¡µÄ Êý¾ÝÀ´Ô´Öڶ࣬¸ñʽ¸´ÔÓ
Êý¾ÝÁ¿´ó£¬µ«ÊDz»Ê®·Ö¹Ø×¢´æ´¢£¬Ò»µ©¾¹ý´¦Àí£¬ÒªÃ´±»¶ªÆú£¬ÒªÃ´±»¹éµµ´æ´¢ ×¢ÖØÊý¾ÝµÄÕûÌå¼ÛÖµ£¬²»¹ý·Ö¹Ø×¢¸ö±ðÊý¾Ý
Êý¾Ý˳Ðòµßµ¹£¬»òÕß²»ÍêÕû£¬ÏµÍ³ÎÞ·¨¿ØÖƽ«Òª´¦ÀíµÄе½´ïµÄÊý¾ÝÔªËØµÄ˳Ðò
4 ÊÔÊöÁ÷¼ÆËãµÄÐèÇó
¶ÔÓÚÒ»¸öÁ÷¼ÆËãϵͳÀ´Ëµ£¬ËüÓ¦´ïµ½ÈçÏÂÐèÇó£º
¸ßÐÔÄÜ£º´¦Àí´óÊý¾ÝµÄ»ù±¾ÒªÇó£¬ÈçÿÃë´¦Àí¼¸Ê®ÍòÌõÊý¾Ý º£Á¿Ê½£ºÖ§³Ö TB¼¶ÉõÖÁÊÇ PB¼¶µÄÊý¾Ý¹æÄ£
ʵʱÐÔ£º±£Ö¤½ÏµÍµÄÑÓ³Ùʱ¼ä£¬´ïµ½Ãë¼¶±ð£¬ÉõÖÁÊǺÁÃë¼¶±ð ·Ö²¼Ê½£ºÖ§³Ö´óÊý¾ÝµÄ»ù±¾¼Ü¹¹£¬±ØÐëÄܹ»Æ½»¬À©Õ¹
ÍêÃÀ WORD¸ñʽ±à¼
***
***
רҵ×ÊÁÏÕûÀí·ÖÏí
Ò×ÓÃÐÔ£ºÄܹ»¿ìËÙ½øÐпª·¢ºÍ²¿Êð ¿É¿¿ÐÔ£ºÄܿɿ¿µØ´¦ÀíÁ÷Êý¾Ý
7 Áоټ¸¸ö³£¼ûµÄÁ÷¼ÆËã¿ò¼Ü
ĿǰÓÐÈýÀà³£¼ûµÄÁ÷¼ÆËã¿ò¼ÜºÍƽ̨£ºÉÌÒµ¼¶µÄÁ÷¼ÆËãÆ½Ì¨¡¢¿ªÔ´Á÷¼ÆËã¿ò¼Ü¡¢¹«Ë¾Îª Ö§³Ö×ÔÉíÒµÎñ¿ª·¢µÄÁ÷¼ÆËã¿ò¼Ü
1 ÉÌÒµ¼¶£º IBM InfoSphere Streams ºÍ IBM StreamBase
2 ½ÏΪ³£¼ûµÄÊÇ¿ªÔ´Á÷¼ÆËã¿ò¼Ü£¬´ú±íÈçÏ£º
Twitter Storm £ºÃâ·Ñ¡¢¿ªÔ´µÄ·Ö²¼Ê½ÊµÊ±¼ÆËãϵͳ£¬¿É¼òµ¥¡¢¸ßЧ¡¢¿É¿¿µØ´¦Àí ´óÁ¿µÄÁ÷Êý¾Ý
Yahoo! S4 £¨Simple Scalable Streaming System ·Ö²¼Ê½µÄ¡¢¿ÉÀ©Õ¹µÄ¡¢·ÖÇøÈÝ´íµÄ¡¢¿É²å°ÎµÄÁ÷ʽϵͳ
3 ¹«Ë¾ÎªÖ§³Ö×ÔÉíÒµÎñ¿ª·¢µÄÁ÷¼ÆËã¿ò¼Ü£º Facebook Puma Dstream£¨°Ù¶È£©
ÒøºÓÁ÷Êý¾Ý´¦ÀíÆ½Ì¨£¨ÌÔ±¦£©
£©£º¿ªÔ´Á÷¼ÆËãÆ½Ì¨£¬ÊÇͨÓõġ¢
8 ÊÔÊöÁ÷¼ÆËãµÄÒ»°ã´¦ÀíÁ÷³Ì
Á÷¼ÆËãµÄ´¦ÀíÁ÷³ÌÒ»°ã°üº¬Èý¸ö½×¶Î£ºÊý¾Ýʵʱ²É¼¯¡¢Êý¾Ýʵʱ¼ÆË㡢ʵʱ²éѯ·þÎñ
Êý¾Ýʵʱ²É¼¯
Êý¾Ýʵʱ¼ÆËã
Óû§²éѯ
ʵʱ²éѯ·þÎñ
ÍêÃÀ WORD¸ñʽ±à¼
***
²éѯ½á¹û