当前位置:首页 > 林子雨大数据技术原理与应用第八章课后题答案
② 用于分割单词的Bolts将接受的句子分解为独立的单词,将单词作为
Tuple的字段名发送出去;
③ 用于计数的Bolts接受表示单词的Tuple,并对其进行统计; ④ 输出每个单词以及单词出现过的次数。
33. 试述采用MapReduce框架进行单词统计,与采用Storm框架进行单词统计,
有什么区别?
MapReduce使用的是Map和Reduce的抽象,而Storm使用的是Spout和Bolts的抽象。
34. Storm 框架中的单词统计Topology定义如下,其中定义了两个Bolt,试述
两个Bolt各自
完成的功能,以及中间结果如何在两个Bolt之间传输。
第一个Bolt用于单词的分割,该Bolt中的任务随机接收Spout发送的句子,并从接收的句子中提取出单词。
第二个Bolt 接收第一个Bolt发送的Tuple进行处理,即统计分割后的单词出现的次数。
每个Bolt使用了Groupings()系列定义了Tuple 的发送方式。
35. 在Storm的单词统计实例中,为何需要使用fieldsGrouping()方法保证相同
单词发送到同一个任务上进行处理?
通过fieldsGrouping()方法,在“word”-上具有相同字段值的所有Tuple将发送到同一个任务中进行统计,从而保证了统计的准确性。
共分享92篇相关文档