xgboost实例分析(xgboost实例推导)

XGBoost是梯度提升集成算法的强大且流行的实现,配置XGBoost模型的一个重要方面是选择在模型训练期间最小化的损失函数。 该损失函数必须匹配预测建模问题类型,以同样的方式,我们必须选择根据问题类型与深学习神经网络的适当的损耗的功能。 XGBoost和损失函数 ExtremeGradientBoosting,简称XGBoost,是梯度提升算法的高效开源实现。因此XGBoost是一个算法、一个开…

XGBoost 是梯度方向提高集成化优化算法的强劲且时兴的完成,配备 XGBoost 模型的一个主要领域是挑选在模型练习期内降到最低的损失函数。

该损失函数务必配对预测分析模型问题种类,以相同的方法,大家需要挑选依据问题种类与深学习培训神经元网络的合理的耗损的作用。

XGBoost 和损失函数

Extreme Gradient Boosting,通称 XGBoost,是梯度方向提高优化算法的高效率开源系统完成。因而 XGBoost 是一个优化算法、一个开源软件和一个 Python 库。

「迷你教程」掌握Xgboost损失函数构建你的完美模型

它最开始由 Tianqi Chen 开发设计,并由 Chen 和 Carlos Guestrin 在 2016 年题写“ XGBoost:A Scalable Tree Boosting System ”的文章中开展了叙述。

它被设计为测算高效率(例如实行速度更快)和高效率,很有可能比别的开源系统完成更合理。

XGBoost 适用一系列不一样的预测分析模型问题,更显着的是分类和重归。 根据降到最低目标函数对数据的损害开展练习。因而,损失函数的选用是一个主要的超参数,立即与要处理的问题种类有关,如同深度神经网络神经元网络一样。

该完成容许根据 objective 超参数特定目标函数,并应用适用大部分状况的有效初始值。

殊不知,针对在练习 XGBoost 模型时应用哪些损失函数,新手依然具有一些疑惑。

在逐渐以前,使我们开展配备

XGBoost 可以当做单独库安裝,而且可以应用 scikit-learn API 开发设计 XGBoost 模型。

安裝 XGBoost 库(假如并未安裝)。这可以在大部分服务平台上应用 pip python 包管理工具来完成。

pip install xgboost

随后,您可以确定 XGBoost 库已恰当安裝而且可以根据运作下列脚本制作来应用。

import xgboost
print(xgboost.._version__)

运作该脚本制作将打印出您已安裝的 XGBoost 库的版本号。

1.1.1

您很有可能在应用新版本的库时碰到问题。不是你的的问题,由于有时候库的最新版会明确提出另外的规定,或是很有可能不太平稳。

假如您在试着运作以上脚本制作时的确碰到不正确,我我们建议您降权到 1.0.1(或更低版)。这可以根据特定要安裝到 pip 指令的版本号来完成,如下所示所显示:

pip install xgboost==1.0.1

假如您见到警示信息,现在可以安心地忽视它。例如,下列是您也许会见到并可以忽视的警示信息实例:

FutureWarning: pandas.util.testing is deprecated. Use the functions in the public API at pandas.testing instead.

假如您必须对于您的开发工具的特殊表明,客户程序实例教程:

XGBoost 安裝手册

XGBoost 源有自身的自定 API,虽然大家将根据 scikit-learn 包装类应用该方式:XGBRegressorXGBClassifier 。这将使人们可以应用 scikit-learn 人工神经网络库文件的整套专用工具来提前准备数据信息和评定模型。

2个模型以同样的形式运作,并选用同样的技术参数来危害决策树算法的建立和加上到集成化的方法。

分类的 XGBoost 损失函数

分类每日任务涉及到在给出键入样版的情形下预测分析每一个很有可能类型的标识或几率。

「迷你教程」掌握Xgboost损失函数构建你的完美模型

具备互斥标识的分类每日任务有2种关键种类:具备2个类标识的二元分类和具备2个以上类标识的多种类型分类。

  • 二元分类:具备2个类标识的分类每日任务。
  • 多类分类:具备2个以上类标识的分类每日任务。

相关不一样种类分类每日任务的其他信息,客户程序实例教程:

人工神经网络中的 4 种分类每日任务,分别是:二元分类、多类分类、多标识分类、不平衡分类。

XGBoost 为这种问题种类中的每一种都保证了损失函数。

在人工神经网络中,典型性的作法是练习模型来预测分析几率每日任务的类组员几率,及其每日任务是不是必须明确的类标识来对预测分析的几率开展后处理工艺(例如应用argmax)。

这类方式 在练习深度神经网络神经元网络开展分类时应用,在使用 XGBoost 开展分类时也建议应用。

用以预测分析二元分类问题几率的损失函数是 binary:logistic ,用以预测分析多类问题类型几率的损失函数是 multi:softprob

  • binary:logistic :用以二进制分类的 XGBoost 损失函数。
  • multi:softprob :用于多类分类的 XGBoost 损失函数。

在配备 XGBClassifier 模型时,可以根据“ objective ”超参数特定这种字符串数组值。

针对二元分类

# 二元分类模型
model = XGBClassifier(objective=\'binary:logistic\')

对于多类分类

# 多元化分类模型
model = XGBClassifier(objective=\'multi:softprob\')

关键的是,假如您不特定 objective 超参数,XGBClassifier 将依据练习过程中给予的数据信息全自动挑选这种损失函数之一。

我们可以根据一个合理有效的事例来实际表明这一点。

下边的实例建立一个生成二元分类数据,应用默认设置超参数在数据上线性拟合 XGBClassifier ,随后打印出模型总体目标配备。

from sklearn.datasets import make_classification
from xgboost import XGBClassifier
# 随机生成数据信息
X, y = make_classification(n_samples=1000, n_features=20, n_informative=15, n_redundant=5, random_state=1)
# 挑选模型
model = XGBClassifier()
# 线性拟合模型
model.fit(X, y)
# 归纳模型损失函数
print(model.objective)

运作实例在数据上线性拟合模型并打印损失函数配备。

我们可以见到模型全自动选取一个损失函数开展二元分类。

binary:logistic

或是,我们可以特定总体目标并线性拟合模型,确定应用了损失函数。

from sklearn.datasets import make_classification
from xgboost import XGBClassifier
# 随机生成数据信息
X, y = make_classification(n_samples=1000, n_features=20, n_informative=15, n_redundant=5, random_state=1)
# 挑选模型
model = XGBClassifier(objective=\'binary:logistic\')
# 线性拟合模型
model.fit(X, y)
# 归纳模型损失函数
print(model.objective)

运作实例在数据上线性拟合模型并打印损失函数配备。

我们可以见到用以特定二元分类损失函数的模型。

binary:logistic

使我们在具备2个以上类的数据上反复此实例。在这样的情况下,三个类型。

下边列举了完善的实例。

from sklearn.datasets import make_classification
from xgboost import XGBClassifier
# 随机生成数据信息
X, y = make_classification(n_samples=1000, n_features=20, n_informative=15, n_redundant=5, random_state=1, n_classes=3)
# 挑选模型
model = XGBClassifier()
# 线性拟合模型
model.fit(X, y)
# 归纳模型损失函数
print(model.objective)

运作实例在数据上线性拟合模型并打印损失函数配备。

我们可以见到模型全自动为多种类型分类挑选了一个损失函数。

multi:softprob

或是,我们可以手动式特定损失函数并确定它用以练习模型。

from sklearn.datasets import make_classification
from xgboost import XGBClassifier
# 随机生成数据信息
X, y = make_classification(n_samples=1000, n_features=20, n_informative=15, n_redundant=5, random_state=1, n_classes=3)
# 挑选模型
model = XGBClassifier(objective=\"multi:softprob\")
# 拟合模型
model.fit(X, y)
# 归纳模型损失函数
print(model.objective)

运作实例在数据上拟合模型并打印损失函数配备。

我们可以见到用以为多种类型归类特定损失函数的模型。

multi:softprob

最终,也有别的损失函数可用以归类,包含:用以二元归类的 binary:logitrawbinary:hinge及其用以多类归类的 multi:softmax

您可以在这里查询详细目录:

Learning Task Parameters: objective

回归的 XGBoost 损失函数

回归就是指在给出键入样版的情形下预测分析标值的预测分析建模问题。

「迷你教程」掌握Xgboost损失函数构建你的完美模型

尽管预测分析几率听起来像一个回归问题(即概率是一个标值),但它通常不被视作回归种类的预测分析建模问题。

预测标值时采用的 XGBoost 目标函数是 reg:squarederror 损失函数。

  • reg:squarederror :回归预测分析建模问题的损失函数。

在配备XGBRegressor模型时,可以根据“ objective ”超参数特定此字符串数组值。

例如:

model = XGBRegressor(objective=\'reg:squarederror\')

关键的是,假如你沒有特定 objective 超参数,XGBRegressor 会全自动给你挑选这一目标函数。

我们可以根据一个合理有效的事例来实际表明这一点。

下边的实例建立一个生成回归数据,在数据集上线性拟合XGBRegressor,随后打印出模型总体目标配备。

from sklearn.datasets import make_regression
from xgboost import XGBRegressor
# 随机生成数据信息
X, y = make_regression(n_samples=1000, n_features=20, n_informative=15, noise=0.1, random_state=7)
# 挑选模型
model = XGBRegressor()
# 拟合模型
model.fit(X, y)
# 归纳损失函数
print(model.objective)

运作实例在数据上拟合模型并打印损失函数配备。

我们可以见到模型全自动选取一个损失函数开展回归。

reg:squarederror

或是,我们可以特定总体目标并拟合模型,确定应用了损失函数。

from sklearn.datasets import make_regression
from xgboost import XGBRegressor
# 随机生成数据信息
X, y = make_regression(n_samples=1000, n_features=20, n_informative=15, noise=0.1, random_state=7)
# 挑选模型
model = XGBRegressor(objective=\'reg:squarederror\')
# 拟合模型
model.fit(X, y)
# 归纳损失函数
print(model.objective)

运作实例在数据上拟合模型并打印损失函数配备。

我们可以见到模型应用特定的损失函数开展回归。

reg:squarederror

最终,也有别的损失函数可用以回归,包含:reg:squaredlogerrorreg:logisticreg:pseudohubererrorreg:gammareg:tweedie

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

(0)
上一篇 2022年5月7日 下午1:19
下一篇 2022年5月7日 下午1:21

相关推荐

  • 推荐几款好用的避孕套(杜蕾斯安全套评测)

    在现在这个社会压力大,生活节奏快的时代,单身男女的比例正在逐年上升。当两个人好不容易走在一起时,想要保持彼此之间的爱意永恒不变,其实是一件非常具有考验的事情。想要感受彼此之间浓烈的爱,想要一直保持伴侣之间的新鲜感,选择一个好的套套是关键!今天就给大家带来一款超级好用的杜蕾斯避孕套安全套超薄至润三合一(AiR润薄4+倍滑超薄8+螺纹4),不知道如何挑选套套的你,快来跟我一起走进它吧! 大家都知道,杜…

    2022年10月20日
    520
  • 茶营销策划方案,卖茶叶的最好销售方法

    一杯当年春茶,就是春天的味道。 从1月20日开始,海南、四川、贵州等地早茶陆续进入采摘期。 昨天雨水时节(2月19日)过后,全国春茶产区大规模进入最佳采制期。随之而来问题就是这些春茶如何卖出去? 虽然新型冠状病毒肺炎疫情对2020年春季茶叶营销带来不利影响。 但为了给消费者献上一杯早春绿茶,大部分茶叶经营者依然坚守岗位并积极做好市场营销工作。 今天的文章,就来聊5家企业的春茶预售玩法(主要参照商家…

    2022年6月26日
    660
  • 网络营销渠道策略包括哪些,5种最好的网络营销方法

    很多朋友问我,互联网现在有很多平台可以利用来做品牌推广,但是哪个产品最适合我呢? 其实做为一个普通刚入行的新手,在选择平台上一定要有自己的思维,不能盲目选择,在刚接触互联网的时候,不要道听途说,现在在互联网上随便搜下,都是满天飞的营销方式,选准最适合自己的才是最关键的。 今天小邦为大家推荐几个自己常用的几个推广方式: 1.新闻源推广 同时也就是我们在网上经常看到的新闻如腾讯,搜狐,新浪等门户网站,…

    2022年6月27日
    640
  • 地摊卖什么赚钱,十元地摊暴利产品大全

    摆地摊是一项销售为主的行业,门槛低,但门道很多。一、摆地摊卖什么好呢?我推荐摆摊卖居家好物。毕竟这种东西需求量大,普适性高,不需要考虑货损和保存问题,非常适合新手进入摆摊领域。什么是居家好物呢?就是家中要用到的各种小东西。但是普通的居家好物显然烂大街了,甚至连2元店都有,怎么可能入我法眼?所以我们要卖既新奇能吸引人,又非常实用,能赚钱,还得有发展前景的东西。即使摆地摊,也得摆一个可以有长期发展的事…

    2022年8月18日
    560
  • 最靠谱的网站建设公司推荐,教你如何选择一家好的网站建设公司

    现在越来越多的企业开始注重网络建设,拥有一个优质企业官网,不仅可以对外展示企业形象,还能达到增强企业实力的效果,如果网站的功能还包括在线订单、客户互动等功能,还能再移动程度上,增加企业销售额,所以网站建设对于企业来说尤为重要,而企业想知道怎么建设网站,靠谱的网站建设公司必不可少。那么目前靠谱的网站建设公司有哪些,应该怎样挑选呢? 网站建设   1、靠谱的网站建设公司有哪些   其实规模较大、管…

    2022年7月27日
    740
  • 微信可以恢复好友吗,微信好友恢复教程

    朋友间的友谊是需要经营的,列表中躺着的那么多好友中,常聊天联系的也就那么几十个,甚至更少,其他的还不是一样会被冷落和荒废掉。 我们是否需要定期删除一些联系人呢?定期清理不熟的人变成了一种习惯。删除一些平时不露头、潜水不冒泡的陌生人,如果实在想不起来他是谁,也就随手删了。 随着微信的影响力日趋壮大,微信关系链变得十分紧密。 在微信好友基数庞大的情况下,很容易导致我们误删除微信好友。如果删除的是自己的…

    2022年7月28日
    1320
  • 中国营销大师有哪些,带你了解中国最牛的营销大师

    今年,手机界可以说是炸开了锅,随着购机人群的不断下降,各大厂家可以说为了保住市场,可以说是使劲了九牛二虎之力,甚至不惜“生死看淡,不服就干!” 不敢,有一家厂商倒是过得挺滋润的,那就是8848,“成功并不是高瞻远瞩,而是你本来就站在高处,运筹帷幄,掌控未来,这才是8848,这才是胸怀天下!”相信大家也一定被这句广告词洗脑过! 8848虽然销量不高,可耐不住他卖贵啊!就拿M3尊享版来说,机身内存12…

    2022年6月5日
    1050
  • seo精准引流如何实现,百度精准引流推广方法

    很多新手可能会觉得,搜索引擎排名是比较难做的,但是只要你掌握了方法,其实它的操作也是很简单的。 今天,我主要从以下几方面来展开详细的分享: 1、如何挖掘更多更精准的关键词? 2、如何选择最佳关键词发布平台? 3、关键词引流的核心 图片来源于网络,侵删 接下来就给大家介绍第一步:如何挖掘更多更精准的关键词? 那么,什么是精准关键词?又如何去挖掘精准关键词呢? 首先我们知道,关键词的精准度直接决定你优…

    2022年6月15日
    620
  • 最贵的几种手机是什么,全球最贵的手机排名

    1973年的一天,21世纪最伟大的东西诞生了,他就是手机,它是由当时摩托罗拉的工程人员马丁·库帕发明,到今天手机已经诞生了四十多年了,手机的用处也越来越广泛,我们从1G到2G,3G再到今天的5G,在这40多年,我们把手机从老的笨重的只能接听电话的设备变为一个到今天一个不到200g的可以满足你的支付,购物,叫车,游戏,查信息,看电视的一个高科技设备,呢你知道现在最贵的手机是哪一款么,今天我就来介绍一…

    2022年6月13日
    730
  • 创业好项目推荐,8个稳赚的女性创业项目

    成为自己心中的白富美是每一个位女性的终极梦想,随着时代的发展,创业已经不再是男士的专属,越来越多的女性也开始寻求经济与精神上的双重独立,并走上了创业之路。在创业的大潮中,一些适合女性创业的项目也应运而生,下面就跟随小编一起来看看2018年最适合女性创业的项目有哪些吧? 1.瑜伽馆 相比健身房来说,瑜伽的训练显得柔和了很多,也更为被人接受。久居城市的人们,经过一周忙碌的工作之后,在周末的时候参加一些…

    2022年5月19日
    720

发表回复

登录后才能评论

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信