专栏名称: 人工智能头条
专注人工智能技术前沿、实战技巧及大牛心得。
目录
相关文章推荐
爱可可-爱生活  ·  【Flow Matching and ... ·  昨天  
CloudMan  ·  网文校对系统 - 新方案 ·  2 天前  
爱可可-爱生活  ·  PENCIL: ... ·  3 天前  
51好读  ›  专栏  ›  人工智能头条

数据科学家必知的21个命令

人工智能头条  · 公众号  · AI  · 2017-06-05 17:59

正文

在这篇文章里,我们将要一睹能快速分析文本数据(如日志,报告等)的最方便工具。很多时候,我们需要的数据并不存储在我们的本机上。所以首先,我们要知道如何链接到远程服务器上并使用它。为此,使用SSH最为合适。(SSH,即Secure Shell,是一个加密网络协议,它能让你在一个不安全的网络上安全地远程登陆和使用其他网络服务)

在Ubuntu的终端你可以用以下几个命令之一来登陆远程服务器。

$ ssh user@host
$ ssh -p port host

通过密钥链接:

$ ssh -i key.pem user@host

在远程主机上执行命令:

$ ssh -i key.pem user@host 'command'

此时,SSH 客户端就已经在Ubuntu的默认程序列表中了。若没有,你可以在终端尝试以下命令。

command sudo apt-get install ssh
On Windows

若你使用微软的Windows,你需要安装一款开源软件PuTTY (地址http://www.putty.org/) 来使用SHH。为了使用PuTTY链接,需要以下几步:

  1. 运行PuTTY并输入你的链接设置:

    a. Host Name: example.com

    b. Port: 22 (leave as default)

    c. Connection Type: SSH (leave as default)

  2. 点击 Open 开启一个SSH回话。

  3. 当打开SSH连接时,你应该会看到一个终端提示让你输入用户名。

  4. 接下来,输入密码。需要注意的是,当输入密码的时,你不会看到游标移动或任何输入字符(如**)。这是一个标准的PuTTY安全特性。点击enter。

  5. 现在你已经可以在终端提示符下使用远程主机了。

SSH的一个好的特性是可以创建secure tunnels。

On Ubuntu

1. 将远程主机连接到本地

进入主机1.1.1.1

ssh -f -N -R 22:192.168.0.1:22 [email protected]

获得主机192.168.0.1的权限

$ ssh localhost

操作:

  • -R 将远程主机(服务器)的某个端口转发到本地端指定机器的指定端口。执行远程重定向。当你访问远程主机的这个端口,就会建立一个SSH隧道,并建立了通向这个主机端口的链接。

  • -N 不执行远程脚本或命令,只在前向端口时使用。

  • -f 经过远程系统认证后立即进入后台模式。

使用ssh隧道一个非常有用的方式就是用于这种通信加密。比如,你在一个开放的网络中使用,但是你不想别人能够拦截你的数据。

2. 将本地机(客户机)的某个端口转发到远端指定机器的指定端口

在本机1.1.1.1输入 http://localhost:80 就会得到访问远程主机192.168.0.1的页面。

ssh -f -N -L 80:192.168.0.1:80 [email protected]

操作:

  • -L 将本地机(客户机)的某个端口转发到远端指定机器的指定端口。

反向隧道用于这种情况,你需要访问一台被防火墙保护或处于NAT之后的主机。

使用PuTTY的SSH隧道功能
  • 在Connection -> SSH -> Tunnels,输入

Source port: 22Destination: localhost:22
  • 选择”Dynamic”,点击“Add”

  • 在会话中输入目标主机地址并选择SSH协议。通过手动输入已保存的会话名来保存你的选择。例如:“HostName with ssh tunnel on 22”,点击“保存”,双击会话名,连接成功。

  • 当SSH会话建立成功,你可以通过浏览器验证链接是否成功。

现在我们连上了主机,已经可以操作了。但是一些命令需要root权限。如果主机允许使用root权限,你可以在终端中执行:

$ sudo -s

在输入root用户的密码后,通过终端向远程主机的链接就会被确认,你也获得了root权限:

我们知道了如何链接到主机和获取必要权限的所有要点,但这还不足以用来分析主机上的数据。接下来还要学习在远程主机上控制、数据获取和获取的基本命令。

使用文件系统

现在,我们开始学习如何使用文件系统。以下是相应的命令用来:

1. 处理文件和文件夹

新建一个文件夹 dir_name

mkdir dir_name

将dir_name重命名为dir_name2

mv dir_name dir_name2

删除文件夹/文件

rm -rf dir_name

操作:

  • -r, -R 处理所有嵌套的子目录。

  • -i 每一个传输链接移除之前需确认

  • -f 若错误是因文件不存在导致,则不以false结束,且不询问是否建立连接

删除所有以file2015开头的文件;*表示任意字符,你可以把它用在任何表示缺失字符的地方。

rm -rf file2015*

创建文件 file_name.txt

touch file_name.txt

重命名文件

mv file_name.txt file_name2.txt

2. 权限

  • ls -la 查看目录下所有文件、文件夹的连接情况及所有权

  • -l 关键的扩展输出

执行file文件的权限

chmod 777 file.sh

R 代表dir_name文件夹所有的文件

chmod -R 777 dir_name - set access 777 recursively

更多信息请参考: https://ru.wikipedia.org/wiki/Chmod

3. 所有者(Owner)/所属群组(Group)

为file.txt文件设置所有者和群组

chown ubuntu:ubuntu file.txt

递归设置所有者和群组

chown -R ubuntu:ubuntu dir_name

4. 查看磁盘空间

显示目前在Linux系统上的文件系统的磁盘使用情况

df -h

获取文件夹大小

du -sh dir_name/

获取文件夹和子目录的大小

du -h dir_name/*

获取文件大小

du -h filename

下面的命令可以用来获取主机系统的状态:

  • 查看内存和交换空间的使用情况

free
  • 实时显示系统中各个进程的资源占用状况

top/htop






请到「今天看啥」查看全文