最近发现了Kaggle这个网站,也在上面完成了一些练习题。于是写一篇博客简单介绍一下Kaggle。

Kaggle是什么?

Kaggle是Google旗下的一个网站,上面有很多机器学习和数据科学的资源(习题,竞赛,入门课程)。用户可以在Kaggle上参与竞赛,一些机构或者公司会设立有奖金的赛事,成为这些赛事的优胜者可以获得奖金。

怎么注册Kaggle账号?

首先进入Kaggle官网(kaggle.com),点击右上角的Regiter,选择Register with Email(如果有Google邮箱可以选择另一个选项)
填写好所有信息,然后你可能会发现,怎么出现了一行红色的提示:Unable to load captcha. Captcha may be unavailable in your country.
解决方法,打开一个新的浏览器(我使用的是edge浏览器,chrome应该也可以,推荐使用这两个)界面,点击浏览器左上角三个点的图标,点击扩展,再点击获取扩展,搜索并安装插件Header Editor
安装好之后在扩展中找到这个插件点击管理,进入如下页面

在图中URL一栏中填写以下地址,点击左边的的下载按钮

点击保存
使用这个插件之后就能显示出注册界面的人机验证了,通过人机验证就能注册好kaggle账号

如何参加Kaggle上的比赛?

注册并且登录kaggle
首页左边栏如下

  • Home 首页
  • Competitions 各种比赛
  • Datasets 各种数据集
  • Models 模型
  • Code 代码
  • Discussions 讨论区
  • Learn 学习
    点击Crate按钮可以新建Notebook,代码等,这里的Notebook更像是jupyter文件,里面支持用markd写笔记和Python代码

我们从首页进入一个比赛的界面,首先在Home界面中间点击Learn to Compete

然后选择Beginner(建议选这个,先加入简单的比赛体验比赛流程),三个比赛随便点击一个进入比赛界面。进入比赛界面后左上角有一个Join Competition按钮,点击这一按钮就能参加当前比赛。
以下图比赛界面为例,一个比赛大概有这些板块

  • Overview 对比赛题目的介绍,包括赛题背景,提交的数据格式等
  • Data 数据,包括对数据格式的解释,可以在这一板块下载数据集
  • Code 上传的代码
  • Models 参赛者上传的模型
  • Discussion 讨论区
  • Leadboard 排行榜
  • Rules 比赛规则
  • Team 你的队伍(如果组建了)
  • Submissions 提交记录
    右上角的Submit Prediction是提交按钮,提交的内容一般包括:预测的数据文件,源代码。File Upload界面中点击Browse Files可以从本地上传文件,Notebook提交在已经保存的Notebook中选择即可。

在Code界面点击New Notebook按钮就能新建一个Notebook编写代码,Notebook的使用类似于jupyter,可以在其中添加Code或Markdown单元,Notebook写完之后记得保存,保存后便能在提交时选中。

Notebook界面简介

每个按钮的功能都能看见(光标移到按钮上后),在Settings里面可以设置Accelerator(加速器),在绑定手机号码之后(首页点击头像中的Settings绑定)每一个账号每周有三十小时的GPU加速时长
右边栏中Input,Output分别代表输入和输出的数据,其中Input中可以选择你正在参加的比赛的数据集,代码运行结束后可以在Output文件夹中下载输出的数据