´óÊý¾Ý¼¼ÊõÔ­Àí¼°Ó¦ÓÃÁÖ×ÓÓê°æ¿ÎºóϰÌâ´ð°¸½âÎö ÏÂÔØ±¾ÎÄ

***

רҵ×ÊÁÏÕûÀí·ÖÏí

3¡¢ÃÀ¹ú¼ÓÖÝ´óѧ²®¿ËÀû·ÖУÌá³öµÄÊý¾Ý·ÖÎöµÄÈí¼þÕ» ´¦Àí¿ÉÒÔ·ÖΪÄÄÈý¸öÀàÐÍ£¿

´ð£º¢Ù¸´ÔÓµÄÅúÁ¿Êý¾Ý´¦Àí£ºÊ±¼ä¿ç¶Èͨ³£ÔÚÊýÊ®·ÖÖÓµ½ÊýСʱ֮¼ä£» ¢Ú»ùÓÚÀúÊ·Êý¾ÝµÄ½»»¥Ê½²éѯ£ºÊ±¼ä¿ç¶Èͨ³£ÔÚÊýÊ®Ãëµ½Êý·ÖÖÓÖ®¼ä£» ¢Û»ùÓÚʵʱÊý¾ÝÁ÷µÄÊý¾Ý´¦Àí£ºÊ±¼ä¿ç¶Èͨ³£ÔÚÊý°ÙºÁÃëµ½ÊýÃëÖ®¼ä¡£

BDASÈÏΪĿǰµÄ´óÊý¾Ý

4¡¢Spark ÒÑ´òÔì³ö½á¹¹Ò»Ì廯£¬¹¦ÄܶàÑù»¯µÄ´óÊý¾ÝÉú̬ϵͳ£¬ÊÔÊö Éú̬ϵͳ¡£

Spark µÄ

´ð£ºSpark µÄÉè¼Æ×ñÑ­¡°Ò»¸öÈí¼þÕ»Âú×㲻ͬӦÓó¡¾°¡±µÄÀíÄÖð½¥ÐγÉÒ»Ì× ÍêÕûÉú̬ϵͳ£¬ ¼ÈÄܹ»ÌṩÄÚ´æ¼ÆËã¿ò¼Ü£¬ Ò²¿ÉÒÔÖ§³Ö SQL¼´Ï¯²éѯ¡¢ ʵʱÁ÷ʽ ¼ÆËã¡¢»úÆ÷ѧϰºÍͼ¼ÆËãµÈ¡£ Spark ¿ÉÒÔ²¿ÊðÔÚ×ÊÔ´¹ÜÀíÆ÷ YARNÖ®ÉÏ£¬Ìṩһ վʽµÄ´óÊý¾Ý½â¾ö·½°¸¡£Òò´Ë£¬ Spark ËùÌṩµÄÉú̬ϵͳͬʱ֧³ÖÅú´¦Àí¡¢½»»¥ ʽ²éѯºÍÁ÷Êý¾Ý´¦Àí¡£

5¡¢´Ó Hadoop+Storm¼Ü¹¹×ªÏò Spark ¼Ü¹¹¿É´øÀ´ÄÄЩºÃ´¦£¿ ´ð£º£¨1£©ÊµÏÖÒ»¼üʽ°²×°ºÍÅäÖá¢Ï̼߳¶±ðµÄÈÎÎñ¼à¿ØºÍ¸æ¾¯£» £¨2£©½µµÍÓ²¼þ¼¯Èº¡¢Èí¼þά»¤¡¢ÈÎÎñ¼à¿ØºÍÓ¦Óÿª·¢µÄÄѶȣ» £¨3£©±ãÓÚ×ö³ÉͳһµÄÓ²¼þ¡¢¼ÆËãÆ½Ì¨×ÊÔ´³Ø¡£

6¡¢ÊÔÊö¡°Spark on YARN¡±µÄ¸ÅÄî¡£

´ð£ºSpark ¿ÉÒÔÔËÐÐÓë YARNÖ®ÉÏ£¬Óë Hadoop½øÐÐͳһ²¿Ê𣬠¼´¡°Spark onYARN¡±£¬ Æä¼Ü¹¹ÈçͼËùʾ£¬×ÊÔ´¹ÜÀíºÍµ÷¶ÈÒÔÀ´

YARN£¬·Ö²¼Ê½´æ´¢ÔòÒÔÀ´ HDFS¡£

ÍêÃÀ WORD¸ñʽ±à¼­

***

***

רҵ×ÊÁÏÕûÀí·ÖÏí

7¡¢ÊÔÊöÈçÏ Spark µÄ¼¸¸öÖ÷Òª¸ÅÄ RDD¡¢DAG¡¢½×¶Î¡¢·ÖÇø¡¢Õ­ÒÀÀµ¡¢¿íÒÀÀµ¡£ ´ð£º¢ÙRDD£ºÊǵ¯ÐÔ·Ö²¼Ê½Êý¾Ý¼¯£¨ Resilient

Distributed

Dataset £©µÄÓ¢ÎÄËõ

д£¬ÊÇ·Ö²¼Ê½ÄÚ´æµÄÒ»¸ö³éÏó¸ÅÄÌṩÁËÒ»Öָ߶ÈÊÜÏ޵Ĺ²ÏíÄÚ´æÄ£ÐÍ¡£ ¢ÚDAG£ºÊÇ Directed Acyclic Graph µÄÒÀÀµ¹ØÏµ¡£

¢Û½×¶Î£ºÊÇ×÷ÒµµÄ»ù±¾µ÷¶Èµ¥Î»£¬ Ò»¸ö×÷Òµ»á·ÖΪ¶à×éÈÎÎñ£¬ ÿ×éÈÎÎñ±»³ÆÎª ¡°½× ¶Î¡±£¬»òÕßÒ²±»³ÆÎª¡°ÈÎÎñ¼¯¡±¡£

¢Ü·ÖÇø£ºÒ»¸ö RDD¾ÍÊÇÒ»¸ö·Ö²¼Ê½¶ÔÏ󼯺ϣ¬ ±¾ÖÊÉÏÊÇÒ»¸öÖ»¶ÁµÄ·ÖÇø¼Ç¼¼¯ºÏ£¬ ÿ¸ö RDD¿ÉÒԷֳɶà¸ö·ÖÇø£¬Ã¿¸ö·ÖÇø¾ÍÊÇÒ»¸öÊý¾Ý¼¯Æ¬¶Î¡£

¢ÝÕ­ÒÀÀµ£º¸¸ RDDµÄÒ»¸ö·ÖÇøÖ»±»Ò»¸ö×Ó RDDµÄÒ»¸ö·ÖÇøËùʹÓþÍÊÇÕ­ÒÀÀµ¡£

£¨ÓÐÏòÎÞ»·Í¼£©µÄÓ¢ÎÄËõд£¬·´Ó³ RDDÖ®¼ä

ÍêÃÀ WORD¸ñʽ±à¼­

***

***

רҵ×ÊÁÏÕûÀí·ÖÏí

¢Þ¿íÒÀÀµ£º¸¸ RDDµÄÒ»¸ö·ÖÇø±»Ò»¸ö×Ó RDDµÄ¶à¸ö·ÖÇøËùʹÓþÍÊÇ¿íÒÀÀµ¡£

8¡¢Spark ¶Ô RDDµÄ²Ù×÷Ö÷Òª·ÖΪÐж¯£¨ Action £©ºÍת»»£¨ Transformation £©Á½ ÖÖÀàÐÍ£¬Á½ÖÖÀàÐͲÙ×÷µÄÇø±ðÊÇʲô£¿

´ð£ºÐж¯£¨ Action £©£ºÔÚÊý¾Ý¼¯ÉϽøÐÐÔËË㣬·µ»Ø¼ÆËãÖµ¡£

ת»»£¨Transformation £©£º»ùÓÚÏÖÓеÄÊý¾Ý¼¯´´½¨Ò»¸öеÄÊý¾Ý¼¯¡£

µÚÊ®ÕÂ

1 ÊÔÊöÁ÷Êý¾ÝµÄ¸ÅÄî

Á÷Êý¾Ý£¬¼´Êý¾ÝÒÔ´óÁ¿¡¢¿ìËÙ¡¢Ê±±äµÄÁ÷ÐÎʽ³ÖÐøµ½´ï

2 ÊÔÊöÁ÷Êý¾ÝµÄÌØµã

Á÷Êý¾Ý¾ßÓÐÈçÏÂÌØÕ÷£º

Êý¾Ý¿ìËÙ³ÖÐøµ½´ï£¬Ç±ÔÚ´óСҲÐíÊÇÎÞÇîÎÞ¾¡µÄ Êý¾ÝÀ´Ô´Öڶ࣬¸ñʽ¸´ÔÓ

Êý¾ÝÁ¿´ó£¬µ«ÊDz»Ê®·Ö¹Ø×¢´æ´¢£¬Ò»µ©¾­¹ý´¦Àí£¬ÒªÃ´±»¶ªÆú£¬ÒªÃ´±»¹éµµ´æ´¢ ×¢ÖØÊý¾ÝµÄÕûÌå¼ÛÖµ£¬²»¹ý·Ö¹Ø×¢¸ö±ðÊý¾Ý

Êý¾Ý˳Ðòµßµ¹£¬»òÕß²»ÍêÕû£¬ÏµÍ³ÎÞ·¨¿ØÖƽ«Òª´¦ÀíµÄе½´ïµÄÊý¾ÝÔªËØµÄ˳Ðò

4 ÊÔÊöÁ÷¼ÆËãµÄÐèÇó

¶ÔÓÚÒ»¸öÁ÷¼ÆËãϵͳÀ´Ëµ£¬ËüÓ¦´ïµ½ÈçÏÂÐèÇó£º

¸ßÐÔÄÜ£º´¦Àí´óÊý¾ÝµÄ»ù±¾ÒªÇó£¬ÈçÿÃë´¦Àí¼¸Ê®ÍòÌõÊý¾Ý º£Á¿Ê½£ºÖ§³Ö TB¼¶ÉõÖÁÊÇ PB¼¶µÄÊý¾Ý¹æÄ£

ʵʱÐÔ£º±£Ö¤½ÏµÍµÄÑÓ³Ùʱ¼ä£¬´ïµ½Ãë¼¶±ð£¬ÉõÖÁÊǺÁÃë¼¶±ð ·Ö²¼Ê½£ºÖ§³Ö´óÊý¾ÝµÄ»ù±¾¼Ü¹¹£¬±ØÐëÄܹ»Æ½»¬À©Õ¹

ÍêÃÀ WORD¸ñʽ±à¼­

***

***

רҵ×ÊÁÏÕûÀí·ÖÏí

Ò×ÓÃÐÔ£ºÄܹ»¿ìËÙ½øÐпª·¢ºÍ²¿Êð ¿É¿¿ÐÔ£ºÄܿɿ¿µØ´¦ÀíÁ÷Êý¾Ý

7 Áоټ¸¸ö³£¼ûµÄÁ÷¼ÆËã¿ò¼Ü

ĿǰÓÐÈýÀà³£¼ûµÄÁ÷¼ÆËã¿ò¼ÜºÍƽ̨£ºÉÌÒµ¼¶µÄÁ÷¼ÆËãÆ½Ì¨¡¢¿ªÔ´Á÷¼ÆËã¿ò¼Ü¡¢¹«Ë¾Îª Ö§³Ö×ÔÉíÒµÎñ¿ª·¢µÄÁ÷¼ÆËã¿ò¼Ü

1 ÉÌÒµ¼¶£º IBM InfoSphere Streams ºÍ IBM StreamBase

2 ½ÏΪ³£¼ûµÄÊÇ¿ªÔ´Á÷¼ÆËã¿ò¼Ü£¬´ú±íÈçÏ£º

Twitter Storm £ºÃâ·Ñ¡¢¿ªÔ´µÄ·Ö²¼Ê½ÊµÊ±¼ÆËãϵͳ£¬¿É¼òµ¥¡¢¸ßЧ¡¢¿É¿¿µØ´¦Àí ´óÁ¿µÄÁ÷Êý¾Ý

Yahoo! S4 £¨Simple Scalable Streaming System ·Ö²¼Ê½µÄ¡¢¿ÉÀ©Õ¹µÄ¡¢·ÖÇøÈÝ´íµÄ¡¢¿É²å°ÎµÄÁ÷ʽϵͳ

3 ¹«Ë¾ÎªÖ§³Ö×ÔÉíÒµÎñ¿ª·¢µÄÁ÷¼ÆËã¿ò¼Ü£º Facebook Puma Dstream£¨°Ù¶È£©

ÒøºÓÁ÷Êý¾Ý´¦ÀíÆ½Ì¨£¨ÌÔ±¦£©

£©£º¿ªÔ´Á÷¼ÆËãÆ½Ì¨£¬ÊÇͨÓõġ¢

8 ÊÔÊöÁ÷¼ÆËãµÄÒ»°ã´¦ÀíÁ÷³Ì

Á÷¼ÆËãµÄ´¦ÀíÁ÷³ÌÒ»°ã°üº¬Èý¸ö½×¶Î£ºÊý¾Ýʵʱ²É¼¯¡¢Êý¾Ýʵʱ¼ÆË㡢ʵʱ²éѯ·þÎñ

Êý¾Ýʵʱ²É¼¯

Êý¾Ýʵʱ¼ÆËã

Óû§²éѯ

ʵʱ²éѯ·þÎñ

ÍêÃÀ WORD¸ñʽ±à¼­

***

²éѯ½á¹û