java决策树算法代码,决策树分类算法代码

小程序：扫一扫查出行
【扫一扫了解最新限行尾号】
复制小程序

决策树（DecisionTree）和随机森林（Random Forests）

令N为训练样例的个数，则单棵决策树的输入样例的个数为N个从训练集中有放回的随机抽取N个训练样例。

令训练样例的输入特征的个数为M，我们在每颗决策树的每个节点上进行分裂时，从M个输入特征里随机选择m个输入特征，且m远远小于M。然后从这m个输入特征里选择一个最好的进行分裂。 m在构建决策树的过程中不会改变。

构建决策树的算法主要有以下三种，且根据决策树的输出结果，决策树可以分为分类树和回归树，分类树输出的结果为具体的类别，而回归树输出的结果为一个确定的数值。其中 ID3 和 C4.5 是分类树， CART 是分类回归树，且在ID3 和 C4.5 中，特征（属性）只能选一次，而 CART 没有这样的要求：

a. ID3 在决策树生成过程中，以信息增益为特征选择的准则。

b. C4.5 在决策树生成过程中，以信息增益比为特征选择的准则。

c. CART 对回归树用平方误差最小化准则，对分类树用基尼指数（Gini index）最小化准则，进行特征选择，生成二叉树。

例：

图1左中的信息增益InfoGain1 及信息增益比 InfoRatio1为：

同理，图1右的信息增益 InfoGain2 及 InfoRatio2 分别为：

由于 InfoGain1 InfoGain2，所以由ID3算法选择第一种方法；

由于InfoRatio1 InfoRatio2 ，所以根据C4.5算法选择第一种方法

当节点的数据量小于一个指定的数量时，不继续分裂。两个原因：一是数据量较少时，再做分裂容易强化噪声数据的作用；二是降低树生长的复杂性。提前结束分裂一定程度上有利于降低过拟合的影响。

由上述可知，熵和基尼值的大小表示数据的复杂程度，当熵或者基尼值过小时，表示数据的纯度比较大，如果熵或者基尼值小于一定程度数，节点停止分裂。

节点的深度可以理解为节点与决策树跟节点的距离，如根节点的子节点的深度为1，因为这些节点与跟节点的距离为1，子节点的深度要比父节点的深度大1。决策树的深度是所有叶子节点的最大深度，当深度到达指定的上限大小时，停止分裂。

按照1生成t个决策树之后，对于每个新的测试样例，综合多个决策树的分类结果来作为随机森林的分类结果。

（1）目标特征为数字类型：取t个决策树的平均值作为分类结果。

（2）目标特征为类别类型：少数服从多数，取单棵树分类结果最多的那个类别作为整个随机森林的分类结果。

在随机森林中，无需交叉验证来评价其分类的准确性，随机森林自带 OOB（out-of-bag）错误估计：

OOB：在构造单棵决策树时我们只是随机有放回的抽取了N个样例，所以可以用没有抽取到的样例来测试这棵决策树的分类准确性，这些样例大概占总样例数目的三分之一。

所以对于每个样例j，都有大约三分之一的决策树（记为SetT（j））在构造时没用到该样例，我们就用这些决策树来对这个样例进行分类。我们对于所有的训练样例 j，用SetT（j）中的树组成的森林对其分类，然后看其分类结果和实际的类别是否相等，不相等的样例所占的比例就是OOB错误估计。OOB错误估计被证明是无偏的。

weka 代码算法 j48 决策树 c4.5

我想你应该是想通过这个页面的url来得到这个网页里面的某些数据把。用HttpClient 。

下面我这个方法是得到搜狗页面命中多少条记录的代码。

public static void main (String args[]){

String sRequestUrlString="

%3D%22%22";

GetMethod getMethod = new GetMethod(sRequestUrlString);

HttpClient client = new HttpClient();

client.setConnectionTimeout(1000 * 60);

int status=0;

try {

status = client.executeMethod(getMethod);

} catch (HttpException e) {

// TODO Auto-generated catch block

e.printStackTrace();

} catch (IOException e) {

// TODO Auto-generated catch block

e.printStackTrace();

}

String sResponse="";

if(status==HttpStatus.SC_OK) {

sResponse=(getMethod.getResponseBodyAsString());

} else {

System.out.println("检索失败");

}

getMethod.releaseConnection();

String regExData = "找到 ([,\\d]*) 个网页";

if(sResponse!=null sResponse.trim().length()0) {

Pattern pattern = Pattern.compile(regExData);

Matcher matcher = pattern.matcher(sResponse);

if(matcher.find()) {

if(matcher.groupCount()=1) {

int iTmpInteger =

Integer.parseInt(matcher.group(1).replaceAll(",",""),10);

System.out.println("找到"+iTmpInteger+"个网页");

}

这段测试代码是来测试搜狗的，String sRequestUrlString="?

query=ondblclick%3D%22%22";

这里是拼写好的检索的url,

sResponse=(getMethod.getResponseBodyAsString());这个是得到本页面的源文件，然后通过

String regExData = "找到 ([,\\d]*) 个网页";正则表达式来获取([,\\d]*) ，得到命中的条数。

java构建二叉树算法

//******************************************************************************************************//

//*****本程序包括简单的二叉树类的实现和前序,中序,后序,层次遍历二叉树算法,*******//

//******以及确定二叉树的高度,制定对象在树中的所处层次以及将树中的左右***********//

//******孩子节点对换位置,返回叶子节点个数删除叶子节点,并输出所删除的叶子节点**//

//*******************************CopyRight By phoenix*******************************************//

//************************************Jan 12,2008*************************************************//

//****************************************************************************************************//

public class BinTree {

public final static int MAX=40;

private Object data; //数据元数

private BinTree left,right; //指向左,右孩子结点的链

BinTree []elements = new BinTree[MAX];//层次遍历时保存各个节点

int front;//层次遍历时队首

int rear;//层次遍历时队尾

public BinTree()

{

}

public BinTree(Object data)

{ //构造有值结点

this.data = data;

left = right = null;

}

public BinTree(Object data,BinTree left,BinTree right)

{ //构造有值结点

this.data = data;

this.left = left;

this.right = right;

}

public String toString()

{

return data.toString();

}//前序遍历二叉树

public static void preOrder(BinTree parent){

if(parent == null)

return;

System.out.print(parent.data+" ");

preOrder(parent.left);

preOrder(parent.right);

}//中序遍历二叉树

public void inOrder(BinTree parent){

if(parent == null)

return;

inOrder(parent.left);

System.out.print(parent.data+" ");

inOrder(parent.right);

}//后序遍历二叉树

public void postOrder(BinTree parent){

if(parent == null)

return;

postOrder(parent.left);

postOrder(parent.right);

System.out.print(parent.data+" ");

}// 层次遍历二叉树

public void LayerOrder(BinTree parent)

{

elements[0]=parent;

front=0;rear=1;

while(frontrear)

{

try

{

if(elements[front].data!=null)

{

System.out.print(elements[front].data + " ");

if(elements[front].left!=null)

elements[rear++]=elements[front].left;

if(elements[front].right!=null)

elements[rear++]=elements[front].right;

front++;

}

}catch(Exception e){break;}

}

}//返回树的叶节点个数

public int leaves()

{

if(this == null)

return 0;

if(left == nullright == null)

return 1;

return (left == null ? 0 : left.leaves())+(right == null ? 0 : right.leaves());

}//结果返回树的高度

public int height()

{

int heightOfTree;

if(this == null)

return -1;

int leftHeight = (left == null ? 0 : left.height());

int rightHeight = (right == null ? 0 : right.height());

heightOfTree = leftHeightrightHeight?rightHeight:leftHeight;

return 1 + heightOfTree;

}

//如果对象不在树中,结果返回-1;否则结果返回该对象在树中所处的层次,规定根节点为第一层

public int level(Object object)

{

int levelInTree;

if(this == null)

return -1;

if(object == data)

return 1;//规定根节点为第一层

int leftLevel = (left == null?-1:left.level(object));

int rightLevel = (right == null?-1:right.level(object));

if(leftLevel0rightLevel0)

return -1;

levelInTree = leftLevelrightLevel?rightLevel:leftLevel;

return 1+levelInTree;

}

//将树中的每个节点的孩子对换位置

public void reflect()

{

if(this == null)

return;

if(left != null)

left.reflect();

if(right != null)

right.reflect();

BinTree temp = left;

left = right;

right = temp;

}// 将树中的所有节点移走,并输出移走的节点

public void defoliate()

{

String innerNode = "";

if(this == null)

return;

//若本节点是叶节点，则将其移走

if(left==nullright == null)

{

System.out.print(this + " ");

data = null;

return;

}

//移走左子树若其存在

if(left!=null){

left.defoliate();

left = null;

}

//移走本节点，放在中间表示中跟移走...

innerNode += this + " ";

data = null;

//移走右子树若其存在

if(right!=null){

right.defoliate();

right = null;

}

/**

* @param args

public static void main(String[] args) {

// TODO Auto-generated method stub

BinTree e = new BinTree("E");

BinTree g = new BinTree("G");

BinTree h = new BinTree("H");

BinTree i = new BinTree("I");

BinTree d = new BinTree("D",null,g);

BinTree f = new BinTree("F",h,i);

BinTree b = new BinTree("B",d,e);

BinTree c = new BinTree("C",f,null);

BinTree tree = new BinTree("A",b,c);

System.out.println("前序遍历二叉树结果: ");

tree.preOrder(tree);

System.out.println();

System.out.println("中序遍历二叉树结果: ");

tree.inOrder(tree);

System.out.println();

System.out.println("后序遍历二叉树结果: ");

tree.postOrder(tree);

System.out.println();

System.out.println("层次遍历二叉树结果: ");

tree.LayerOrder(tree);

System.out.println();

System.out.println("F所在的层次: "+tree.level("F"));

System.out.println("这棵二叉树的高度: "+tree.height());

System.out.println("--------------------------------------");

tree.reflect();

System.out.println("交换每个节点的孩子节点后......");

System.out.println("前序遍历二叉树结果: ");

tree.preOrder(tree);

System.out.println();

System.out.println("中序遍历二叉树结果: ");

tree.inOrder(tree);

System.out.println();

System.out.println("后序遍历二叉树结果: ");

tree.postOrder(tree);

System.out.println();

System.out.println("层次遍历二叉树结果: ");

tree.LayerOrder(tree);

System.out.println();

System.out.println("F所在的层次: "+tree.level("F"));

System.out.println("这棵二叉树的高度: "+tree.height());

}

正文

决策树（DecisionTree）和随机森林（Random Forests）

weka 代码算法 j48 决策树 c4.5

java构建二叉树算法

相关阅读

幼稚的单机游戏，幼稚的单机游戏有哪些

linux查看分区命令6，linux查看分区命令

灰太狼虚拟主机，灰太狼虚拟主机图片

js控制页面隐藏的方法汇总，js设置隐藏

java中个人信息的代码 java中个人信息的代码有哪些

木鱼app下载，木鱼app下载正版

微信视频号如何做音乐视频，微信视频号怎么做音乐视频

flutter中文是什么意思，flutter 中文

目录[+]

决策树（DecisionTree）和随机森林（Random Forests）

weka 代码 算法 j48 决策树 c4.5

java构建二叉树算法

相关阅读

幼稚的单机游戏，幼稚的单机游戏有哪些

linux查看分区命令6，linux查看分区命令

灰太狼虚拟主机，灰太狼虚拟主机图片

js控制页面隐藏的方法汇总，js设置隐藏

java中个人信息的代码 java中个人信息的代码有哪些

木鱼app下载，木鱼app下载正版

微信视频号如何做音乐视频，微信视频号怎么做音乐视频

flutter中文是什么意思，flutter 中文

目录[+]

weka 代码算法 j48 决策树 c4.5