Machine-learning mind map

最近总是会忘记一些概念,对于机器学习的框架有些混淆模糊了,所以做了一个思维导图帮助理清框架,以期学习时有的放矢。

1. 什么是机器学习?

  • 机器学习是通过编程让计算机从数据中进行学习的科学和艺术。充分利用这些技术可以极大的提高人类生产的效率,是新一代的技术革命。

2. 为什么要用机器学习方法呢?

  • 原因如下:
    • 需要进行大量手工调整或需要拥有长串规则才能解决的问题:机器学习算法通常可以简化代码、提高性能。
    • 问题复杂,传统方法难以解决:最好的机器学习方法可以找到解决方案。
    • 环境有波动:机器学习算法可以适应新数据。
    • 洞察复杂问题和大量数据

ANOVA

前言

方差分析(analysis of variance)是在概率与统计学中很重要的一部分内容,方差分析用于检验多对数据的平均数差之间的显著性,如果是采用t检验的话,只能每次对2组数据进行检验,对于n组数据则需要进行2的排列组合次,并且即使每次的置信度为95%,累乘起来的置信度也不高,即容易犯错,所以需要新方法,方差分析就是解决这个问题的方法。在这一篇博客中我们只讨论单因素方差分析

pipe-Linux

使用管道操作符“|”可以把一个命令的标准输出传送到另一个命令的标准输入中,连续的|意味着第一个命令的输出为第二个命令的输入,第二个命令的输入为第一个命令的输出,依次类推。

Electron

简介

linear-algebra

I am going to share some experiences in the process that I study the linear Algebra, it is really excited that I just find a super nice textbook named Linear Algebra and the Applications. I really recommend it if you are going to study the linear algebra especially when you are mindless in which book that you should read.

Life tips: Never judge others by your value, learn to accept the diversity, this is what the world looks like. Respect each other!

概率统计

概率论与数理统计是一门很重要的基础数学课,现在的机器学习的基础之一。现在这里添加的是这门学科的总览图,后期可能会做进一步的详细笔记。

symbolic-hard_link

在Linux的应用当中,掌握软硬链接的方法很重要,学会软硬链接可以让我们更方便的使用Linux系统中的文件,特别是以项目的方式去管理文件时,可以在单个项目之内创建软硬链接,而在其他的项目当中也可以创建同样的软硬链接指向同样的脚本、软件等,这样子可以实现文件个高效复用,既能便捷实用,又能避免重复造轮子。

seaborn_visualization

New package for data visualization. This package is base on the matplotlib, numpy, scipy , and pandas. The shining point is that this package is easier for people to create a beautiful picture for your dataset, this is essential for the data science. So let’s get it. This is the official URL: http://seaborn.pydata.org/
You can turn to there for help.

目录

  • 可视化统计关系

  • 绘制分类数据

  • 数据分布

  • 双变量分布


Step0:什么是seaborn

  • Seaborn是基于matplotlib的图形可视化python包。它提供了一种高度交互式界面,便于用户能够做出各种有吸引力的统计图表。
  • Seaborn是在matplotlib的基础上进行了更高级的API封装,从而使得作图更加容易,在大多数情况下使用seaborn能做出很具有吸引力的图,而使用matplotlib就能制作具有更多特色的图。应该把Seaborn视为matplotlib的补充,而不是替代物。同时它能高度兼容numpy与pandas数据结构以及scipy与statsmodels等统计模式。
  • seaborn 有五种风格,分别为”darkgrid”, “whitegrid”, “dark”, “white”, “ticks”

working_with_files

在Linux中,有着处理文本的三大常用的、非常强大的工具——awk/grep/sed,其中awk是报告生成工具,适合处理列数据;grep是文本过滤搜索工具;sed是文本编辑工具,完成一般的编辑工作。接下来我将学习如何使用这3个工具。PS:这三个工具操作的文本都可以通过重定向的方式输出到新文件中保存下来。

data_visualization

开始学习数据可视化,在此记录,目前主要是先学Python中的matplotlib这个包,这个包和MATLAB中的作图很相似,具有很高的自定义性,等到这个学习的比较深入后再考虑了解拓展其他工具的作图。附上学习链接:https://matplotlib.org/gallery/index.html

直接到官网学习是最方便的,文档详细demo生动

补充

这是新发现的一张思维导图,非常清晰的展示了matplotlib的结构,非常helpful。

matplotlib

目录

  • 1. 基础画图

  • 2. 画图进阶

第一部分:基础画图