我编程的时候用的最多的就是交互式编程环境IDE和可视化共享文档格式,个人觉得很适合老师使用,用了很久但是没有仔细研究过详细功能,偶然看到一篇文章整理出来分享给同学们!
介绍
在机器学习和人工智能领域,学习编程是必不可少的,尤其是在工程层面。无论是爬虫计算、深度学习还是可视化,找到一个适合自己、熟悉的编程环境非常重要。
在进行数据科学项目时,应该使用哪种 IDE/环境/工具。从特定语言的 IDE(如 R)到通用文档编辑器(如 Text 或 Atom)——对于初学者来说,这种选择可能令人望而生畏。
如果说有一款工具是每个数据科学家都应该使用或必须使用的话,那就是 (原名 )。它功能强大、用途广泛、可共享,并且提供了在同一环境中执行数据可视化的能力。
允许数据科学家创建和共享他们的文档,从代码到完整的报告。它们帮助数据科学家简化工作、提高生产力并轻松协作。由于这些和其他几个原因,笔记本是数据科学家中最受欢迎的工具之一。
我们将向您介绍它并深入了解它的功能和优点。
希望您已经很好地了解如何将其用于机器学习项目,以及为什么它被认为比该领域的其他标准工具更好!您准备好学习了吗?让我们开始吧!
目录
什么是?
它是一个开源的网络应用程序,允许我们创建和共享代码和文档。
它提供了一个环境,您可以在其中记录代码、运行代码、查看结果、可视化数据并查看效果,而无需离开环境。这使它成为执行端到端数据科学工作流程的便捷工具 - 数据清理、统计建模、构建和训练机器学习模型、可视化数据以及许多其他用途。
习惯上,它是一个编程环境,指的是写好的代码或程序,也可以称为笔记本。
当你还处于原型设计阶段时,它确实非常方便用户使用。这是因为你的代码是在独立的单元中编写的,这些单元可以单独执行。这允许用户测试项目中的特定代码块,而无需从脚本的开头执行代码。许多其他 IDE 环境(例如)也以各种方式实现了这一点,但就我个人而言,我觉得 的单单元结构是最好的。
IDE 是数据科学家手中非常灵活、交互性强且功能强大的工具。它们甚至允许您运行除 IDE 之外的其他语言,如 R、SQL 等。由于它们比 IDE 平台更具交互性,因此它们被广泛用于以更具教学性的方式显示代码。
(前段时间有一篇文章说,所有的论文都应该以可以验证、可重复的格式发表,科学的核心就是可重复、可验证,这样才更容易传播和学习。)
如何安装
您需要先在计算机上安装它。2.7 或 3.6(或更高版本)都可以。
对于新用户来说,普遍的共识是您应该使用发行版的安装和。
两种工具均已安装,并包含大量数据科学和机器学习社区常用的软件包。您可以从 下载最新版本。
PIP 方法
如果出于某种原因,您没有使用 pip,那么您需要确保您的机器正在运行最新的 pip 版本。如果您已经安装了 pip,那么 pip 已经存在。要升级到最新的 pip 版本,请按照以下代码操作:
#Linux和OSx
pip install -U pip setuptools
#Windows
python -m pip install -U pip setuptools
一旦 pip 准备就绪,您就可以继续安装它:
#For Python2
pip install jupyter
#For Python3
pip3安装jupyter
您可以查看官方安装文档。
入门!
现在您了解了这些的用途以及如何在您自己的机器上设置它们。
要运行你的程序,只需输入以下命令就可以了!
jupyter notebook
完成此操作后,笔记本将在您的默认 Web 浏览器中打开,网址如下:
:8888 /树
在某些情况下,它可能不会自动打开。将使用令牌密钥在终端/命令提示符中生成一个 URL。打开后,您需要将整个 URL(包括令牌密钥)粘贴到浏览器中。
打开后,您会在顶部看到三个选项卡:、和。文件基本上列出了您的所有文件,显示了您当前打开的终端和程序,以及。
要打开新笔记本,请点击页面右侧的“新建”选项。这里有四个选项可供选择:
在文本文件中,您将获得一个空白面板。添加您想要的任何字母、单词和数字。它基本上可以用作文本编辑器(类似于 上的应用程序)。您还可以选择一种语言(R、、Go、、Html 等),这样您就可以编写脚本。您还可以在文件中查找和替换单词。
在文件夹选项中,它的作用正如其名称所暗示的那样。您可以创建一个新文件夹来放置文档,重命名它并删除它,无论您的要求是什么。
注意:最好在开始之前创建一个你熟悉的根文件夹
的工作方式与 Mac 或计算机上的 ( 上的 cmd)完全相同。它可以支持 Web 浏览器中的终端会话。
但在本文中,我们将重点介绍,因此我们将从新建选项中选择 3 选项。您将看到以下屏幕:
然后,您可以开始导入最常见的库:和。在代码上方的菜单中,您可以选择使用单元格:添加、编辑、剪切、上下移动单元格、在单元格中运行代码、停止代码、保存您的工作并重新启动内核。
在下拉菜单中(如上所示),您甚至有四个选项:
使用的魔法函数
开发人员插入了预定义的魔法函数,使您的生活更轻松,工作更具交互性。您可以通过运行以下命令查看这些函数的列表(注意:“%”通常不需要,通常是打开的):
%lsmagic
您会看到列出的很多选项,甚至可能认识一些!像 %、%、% 和 % 这样的函数您以前一定见过。现在,魔法命令以两种方式运行:
顾名思义,line- 是指您想要执行单个命令行,而 cell- 是指您想要执行的不仅仅是一行而是单元格中的整个代码块。
在一行中,所有给定的命令都必须以 % 字符开头,而在单元格中,所有命令都必须以 %% 开头。请参阅以下示例以便更好地理解:
逐行方法:
%time a =range(10)
单元方法:
%% timeit a =range(10)
min(a)
我建议你自己运行这些命令,亲自看看有什么区别!(一行代码的执行时间,整个单元格的执行时间)
不限于 - 在笔记本中使用 R,以及
魔法不止于此。你甚至可以在笔记本中使用其他语言,例如 R、、、HTML 等。如果你喜欢 R 中的 '' 包,使用它进行探索性数据分析是一项强大的功能。
要在 中启用 R,您需要 提供的“R”内核(R 专用内核)。这是一个 8 步过程,已详细说明并附有屏幕截图以指导您。
如果您是用户,您也可以在笔记本中使用它!查看专注于为用户学习数据科学以及如何在您的环境中利用它的文章。
如果您更喜欢使用 '' 内核,建议使用 ''。查看此存储库,。它将引导您完成在不同操作系统上安装此内核所需的步骤。请注意,您需要先安装 Node.js 和 npm,然后才能使用它。
笔记本中的交互式仪表板--为什么不呢?
在添加之前,您需要导入 包:
from ipywidgets import widgets
基本类型是典型的文本输入、基于输入和按钮。请参阅以下示例,了解交互式小部件的外观:
您可以查看有关小部件的综合指南。
键盘快捷键 - 节省时间并提高生产力!
快捷键是笔记本的一大优点。如果要运行任何代码块,只需按 Ctrl + 。笔记本提供了更多键盘快捷键,可为我们节省大量时间。
以下是一些在您入门时非常有用的快捷方式。强烈建议您逐一阅读。
笔记本提供两种不同的键盘输入模式 - 命令和编辑。命令模式将键盘绑定到笔记本级命令,由灰色单元格边框和蓝色左边距表示。编辑模式允许您在活动单元格中输入文本(或代码),由绿色单元格边框表示。
使用 Esc 和 分别在命令模式和编辑模式之间切换。现在就尝试一下!
进入命令模式后(即,您没有活动单元格),您可以尝试以下快捷方式:
在编辑模式下(在命令模式下按下进入编辑模式),您将发现以下快捷方式:
要查看完整的键盘快捷键列表,请在命令模式下按“H”或转到“帮助”>“键盘快捷键”。请定期回来查看,因为经常会添加新的快捷键。
有用的笔记本扩展
扩展程序是提高笔记本电脑效率的一种非常有效的方法。安装和使用扩展程序的最佳工具之一是“扩展程序”。只需两个简单的步骤即可将其安装在您的机器上(还有其他方法,这是最方便的):
步骤 1:从 pip 安装:
pip install jupyter_contrib_nbextensions
第 2 步:安装相关文件和 CSS 文件:
jupyter contrib nbextension install --user
完成此操作后,您将在主页顶部看到“”标签。瞧!您可以访问大量可用于项目的出色扩展。
要启用扩展程序,只需单击它即可激活它。以下是 4 个最有用的扩展程序:
这些只是您可以使用的部分扩展。您可以自行查看整个列表并进行实验。
保存并共享你的笔记本
这是笔记本最重要和最棒的功能之一。如果我们正在写一篇博客文章,而我的代码和评论在一个文件中,我需要先将它们转换为另一种格式。请记住,这些笔记本是 JSON 格式,在共享时用处不大。
转到“文件”菜单,您将看到“下载为”选项:
我们可以将笔记本保存在提供的 7 个选项中的任何一个中。最常用的是 .txt 文件,这样其他人就可以在他们的机器上复制您的代码,或者以网页形式打开的 .html 文件(当您想要保存嵌入在 .html 文件中的图像时,这会派上用场)。
您还可以使用这些选项将笔记本手动转换为其他格式,如 HTML 或 PDF。
您还可以使用,它允许您在其服务器上托管笔记本并与多个用户共享。许多领先的研究项目都使用它来进行协作。
(很多比赛都有)
- 笔记本的演变
它于今年 2 月推出,被认为是笔记本电脑的进化。它允许以更灵活、更强大的方式处理项目,但使用与笔记本电脑相同的组件。环境与笔记本电脑完全相同,但体验更高效。
它允许您在一个窗口中安排笔记本、终端、文本文件和输出的工作区!只需将单元格拖放到您想要的位置即可。您还可以使用实时预览编辑、流行的文件格式(如 CSV 和 JSON)来查看实际文件中实时发生的更改。
如果您想在您的机器上尝试,您可以查看安装说明。
开发人员的长期目标是最终取代笔记本电脑。但目前这还有点遥远。
最佳实践
虽然独自完成一个项目很有趣,但大多数时候你会发现自己是在团队中工作。在这种情况下,遵循指南和最佳实践很重要,以确保你的代码和笔记本得到适当的注释,以与团队成员保持一致。这里,我们列出了一些在使用笔记本时应该遵循的最佳实践指南:
当您考虑创建演示文稿时,首先想到的工具是幻灯片。但您也可以用笔记本制作幻灯片!
要将代码块转换为幻灯片,请转到视图 -> 单元格工具栏,然后单击幻灯片。太棒了!现在每个代码块右侧都会有一个幻灯片类型下拉选项。您将获得以下 5 个选项:
测试每个选项以更好地理解它。它将改变您呈现代码的方式!
章节
请注意,这并不是我们可以用笔记本完成的所有功能的详尽列表。有许多功能需要探索和熟悉,使用得越多越好。与许多事情一样,关键在于尝试。当然,网上有很多例子,你最好注册一个账户,这样你就能学到很多东西。
看一下这个存储库,其中包含一系列令人着迷的笔记本。
沈浩老师
——————
中国传媒大学新闻学院教授、博士生导师
中国传媒大学调查与统计研究所所长
大数据挖掘与社会计算实验室主任
中国市场研究协会会长