selecting_DEgenes

前言

最近在做毕设内容,也是转录组的基因数据挖掘工作。这个项目题目是:“黄鳍鲷脑组织转录组性别相关功能基因的数据挖掘”。在前面的分析中,我们已经得到了黄鳍鲷的样本的RNA数据,并进行了无参转录组的组装,salmon的定量mapping,R中edgeR的差异分析,得到了差异基因的table文件,并且将这些差异基因进行了blastx到nr数据库的注释工作,得到了nr注释的table文件,有了这些文件后,我们就可以着手筛选我们的目标基因了。当然,另一个工作是对nr的注释结果进行GO、KEGG的注释与富集分析,这个是从整体层面上来了解我们差异分析得到的差异基因的总体情况,与我们现在进行的特定功能的基因的筛选关联性并不密切。

spider-introduction

前言

什么是爬虫?爬虫有什么作用?在哪有爬虫?对于数据分析师而言并不陌生,但是对于毫无编程经验的人来说,这可能就是一个很迷惑的名词了。其实“爬虫”指的是在互联网中的自动下载器,因为这个自动下载的过程就像是虫子在互联网的大网上爬动寻找到的,所以生动形象的称为“爬虫”,如百度、Google等搜索引擎的网页索引,都是通过对全网的数据进行爬取下载后建立的,所以其实爬虫和我们的生活非常密切,毕竟每个互联网民在网上获取信息时都会使用搜索引擎,甚至我们每天都需要使用这些服务,与我们的生活和工作都分不开,而搜索引擎的服务就是建立在爬虫获取全网信息的基础上的。那我们能不能也利用爬虫来帮自己获取信息呢?当然可以。所以接下来我们先系统了解一下爬虫。

Entrepreneurship

前言

这学期在辅修学校的“创业与融资”的课程,参考书目是《创业管理》——一本经典的创业学教材。书上有个例子,把创业和游泳进行类比:如果你理论学得再好,但从来也不下水,那你永远也学不会游泳;也有人自豪地说他学游泳就是在河里、泳池里自己扑腾学会的游泳,确实如此,但是多数只会单一的一种泳姿,如果你想学会并且掌握自由泳、蝶泳、仰泳等技巧,并且游的又快又好,那么教练的指导就显得很重要了。这个类比就很生动的阐述了理论指导与实践之间相互配合对于创业活动的重要性。这也符合马哲里的实践论与认识论,实践是认识的目的与来源,实践促进认识,认识指导实践更好进行。所以,要想进行创业,认识与实践二者缺一不可,现在这门课主要就是进行理论知识的积累,这也是很重要的一部分内容,需要好好学习掌握。

TheMasterAlgorithm

前言

最近在阅读美国华盛顿大学计算机科学教授佩德罗·多明戈斯(Pedro Domingos)的书籍《终极算法》(The Master Algorithm)。多明戈斯教授深入浅出的介绍了现在在人工智能和机器学习领域的学派和常见算法,并且以生动形象的例子阐述了各种学派与算法的优缺点与应用领域,是一本非常好的人工智能科普读物,阅读之后颇有收获,可以让人有种一览机器学习全貌之感,可以非常好的把握现在的人工智能及机器学习的发展概况。如果以后想从事相关领域的学习与工作,非常推荐一读。

English_learning

前言

最近这段时间复习了一下英语的基础知识,有所感悟,细想以往学习的时候总是对于英语的一些基础知识一知半解,甚至不解,也没有怎么好好夯实过,现在正好是准备研究生考试的过程,便顺便重新学习了一下英语的基础,之前感觉困惑的地方,颇有醍醐灌顶之感,现在来分享一下最近的学习成果。(学习资料来自知乎博主阿丁的猫)。

matplotlib软件架构

前言

在之前的时间里,我学习过matplotlib这个python包,了解了一些画图的技巧,但是在那时便有一些疑惑无法解答,比如为什么画出同一幅图的操作途径有好几种,这些困惑一直都在,以及为什么在matplotlib这个包下属的方法里,到底有几个方法,这些方法间又是什么关系。因为这些疑惑都无从求解,所以对matplotlib的理解也只是皮毛而已,因此为了更加通透的理解matplotlib,我特地查询了matplotlib的软件架构。

network-fixing

前言

这几天看到了一个有意思的文章,介绍了网络故障排查的思路,这和计算机网络的知识有比较大的关联,是一个很好的网络知识应用的实践,值得一学。所以接下来我就来进行一下操作实践。

极限在微积分中的意义

微积分的建立基石

最近在复习高数,刚刚看完了极限和导数的相关内容,有一些新的收获。回想在大一刚刚开始学习高数的时候,整个知识体系并不完整,没有办法看到全貌,实际上是一团浆糊,所以没有意识到极限之于微积分的重要性,也没有掌握到微积分的精髓。现在仔细看来,微积分之所以成为了近几百年来的数学的智慧的结晶,极大地推动了社会和科学的发展,主要得益于微积分的严谨性。正是因为微积分建立在严丝无缝的数学基石上,才能够屹立百年不倒,并且一直照耀着科学的发展。

nlp-6-基于深度学习的文本分类3

前言

在昨天我们实践了word2vec模型,今天还是来学习一个深度学习文本分类模型——bert,这是一个在文本分类中非常著名的模型。接下来让我们来学习一下这个模型。

history

nlp-5-基于深度学习的文本分类2

前言

昨天我们采用了fasttext进行文本处理分类,今天我们使用word2vec模型进行训练。

什么是word2vec模型?

word2vec工具主要包含两个模型:跳字模型(skip-gram)和连续词袋模型(continuous bag of words,简称CBOW),以及两种高效训练的方法:负采样(negative sampling)和层序softmax(hierarchical softmax)。值得一提的是,word2vec词向量可以较好地表达不同词之间的相似和类比关系。