`
guafei
  • 浏览: 323178 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论
文章列表
这个练手的项目要改动三个部分: fullbuild(dump.sh 和store-ajoin-conf.xml) store service(增加这些字段的搜索、排序、显示功能) 即时更新(除ditu_range外都需要即时更新) fullbuild工程:首先改动dump.sh,主要是从数据库中dump下所需要字段的值,这里就涉及到shell的编写。我们从数据库中dump下来的数据字段以\0分割,行以\b分割。其次是改动store-ajoin-conf.xml配置文件,具体看:http://guafei.iteye.com/admin/blogs/939331 还有注意几个path,table ...
因为需要在windows下跑hadoop,所以需要装个模拟器cygwin,网上查了查资料,发现装这个玩意儿还蛮麻烦的。 1、官方安装向导:http://www.cygwin.com/cygwin-ug-net/setup-net.html#internet-setup 2、可以一致点击“下一步”,在需要指定“Local Package Directory”的界面上指定一个安装目录即可。 3、难点就在选择下载的镜像站点了,据说很多站点都是不行的,少数还是可以的,我选择的是“https://mirrors.kernel.org”。 4、在“Select Packages”页面,框中列了一堆的 ...

基础学习1

在一个类中,可以定义接口 public class ProcessFiles { public interface Strategy{ void process(File file); } } 接口Strategy内嵌在ProcessFiles中,要实现接口必须实现ProcessFiles类,它为读者提供更多的上下文信息 把字节层次中的类和字符层次中 ...
对于store的fullbuild代码解释: store-ajoin-conf.xml配置文件的table表 属性path   /store/in/目录是用来放从数据库dump下来的数据(并且不用跑map-redurce)  /store/out/目录放着是跑map-redurce程序的产生的数据,还有可以放一些BI提供的数据      最终这两个目录的数据都会被join在一起 属性record_separator   为什么有些是\b\n,有些是\b       首先我们从数据库中dump下来的数据  字段以\0分割,行以\b分割      但是hadoop对dump下来的文件的分割是以\n分 ...
感谢当当,在跑写这个程序的时候,当当让我了解了很多新的知识 这是两个比较经典的提问: http://topic.csdn.net/u/20071119/23/8af044b3-8c28-4db0-8303-4a8679f2356d.html http://topic.csdn.net/u/20071209/10/c01ad9da-08cb-452c-9230-dff429619361.html 本程序要做的事情是:从cache服务器中读取店铺访问量数据,然后入库。 问题的难点 : 1 :全国所有店铺的key(city_storeId)有750万,数据量很大,导致跑的时候经常内存溢出 2 : ...
package com.IO; import java.io.File; import java.io.RandomAccessFile; import java.nio.MappedByteBuffer; import java.nio.channels.FileChannel; /** * * map(FileChannel.MapMode mode,long position, long size) * * mode - 根据是按只读、读取/写入或专用(写入时拷贝)来映射文件,分别为 FileChannel.MapMode 类中所定义的 * READ_ONLY、READ_ ...
package com.IO; import java.io.RandomAccessFile; import java.nio.MappedByteBuffer; import java.nio.channels.FileChannel; /** * * @author guafei.wgf * java程序读取上G的文件 * */ public class LargeMappedFiles { static int length = 0x8FFFFFF; // 128 Mb public static void main(String[] args) throws E ...

文件删除

package com.IO; import java.io.File; /** * * @author guafei.wgf * 删除本地文件 * */ public class DeleteFiles { public static void main(String args[]) { DeleteFiles t = new DeleteFiles(); delFolder("d:/test"); System.out.println("OK"); } // 删除文件夹 // param folderPath 文 ...

文件合并

package com.IO; /** * 合并文件:合并由拆分文件拆分的文件 * 要求将拆分文件放到一个文件夹中 * 主要利用随机文件读取和文件输入输出流 */ import java.io.File; import java.io.FileInputStream; import java.io.IOException; import java.io.RandomAccessFile; ...
package com.IO; import java.io.File; import java.io.FileOutputStream; import java.io.RandomAccessFile; /** * 文件分隔器:给定文件的路径和每一块要拆分的大小,就可以按要求拆分文件 * 如果指定的块给原文件都还要大,为了不动原文件,就生成另一个文件,以.bak为后缀,这样可以保证原文件 * 如果是程序自动拆分为多个文件,那么后缀分别为".part序号",这样就可以方便文件的合并了 原理:很简单,就是利用是输入输出流,加上随机文件读取。 */ public cl ...
eclipse执行一个程序时候是这样, 鼠标右键 —> Run As —> 然后会有两个 第一个是 Java Application 当然就是楼主说的直接运行了 第二个是 Open Run Dialog...  前面还有一个绿色的圆圈里面还有一个白三角形, 要是想输入 main函数的参数 的话,点这个 Open Run Dialog... 然后会看到一个界面 左侧是一排类(也可能没有,因为你项目要是没写类的话,那肯定没有,我是假设你的项目中有不少类的情况的样子),首先看看有没有你想运行的类,如果没有,点击 左侧这一排类 最上面 有一行图标, 第一个图标样子是一个 白文件(右上角还有一 ...
师傅:http://hi.baidu.com/lzpsky/blog 萝卜:http://lwg2001s.iteye.com/ 焦圈:http://www.jiajun.org/ 金银花:http://glemir.xplore.cn/ 薯条:http://www.shaxiaozi.com/ 节节根:https://joyqi.com/ 包子:http://axiong.me/
转自:http://sundful.iteye.com/blog/704079 XShell是一款Windows下非常优秀的远程连接Linux主机的工具,是我平常使用不可缺少的工具。今天没事看了下XShell的帮助,找到了一些很实用的技巧,分享给大家。 复制和粘贴 由于在linux的Shell下 ...
1、安装JDK 1.1、到官网下载相关的JDK,这里下载的是 jdk-6u23-linux-i586.bin。 网站:http://www.oracle.com/technetwork/java/javase/downloads/index.html 1.2、在“administrator个人文件夹”建立一个“Java文件夹“,(即位置->主文件夹->administrator); 将下载的 jdk-6u23-linux-i586.bin放置这个Java的文件夹。 (路径可以根据自己的实际情况进行修改,这里以administrator下的Java文件夹为例子) ...
光标控制命令 命令                  光标移动 h或^h                  向左移一个字符 j或^j或^n             向下移一行 k或^p                  向上移一行 l或空格                      ...
Global site tag (gtag.js) - Google Analytics