专栏名称: 大数据应用
数据应用学院被评为2016北美Top Data Camp, 是最专业一站式数据科学咨询服务机构,你的数据科学求职咨询专家!
目录
相关文章推荐
人工智能与大数据技术  ·  阿里云通义灵码 AI 程序员全面上线,宣称 ... ·  21 小时前  
大数据文摘  ·  RTX5090震撼发布,一文带你看懂英伟达C ... ·  昨天  
大数据分析和人工智能  ·  各省女生长相排行榜 ·  昨天  
数据派THU  ·  大数据能力提升项目|学生成果展系列之四 ·  3 天前  
51好读  ›  专栏  ›  大数据应用

每日一练 | Data Scientist & Business Analyst 面试题 161

大数据应用  · 公众号  · 大数据  · 2017-08-15 09:17

正文

从6月15日起,数据应用学院将与你一起温习数据科学(DS)和商业分析(BA)领域常见的面试问题。希望积极寻求相关领域工作的你每天关注我们的问题并且与我们一起思考,我们将会在第二天给出答案。

Day 61

DS Interview Questions

What's difference between pca and kernel pca?

BA Interview Questions

R language:

Using i

欲知答案如何?请见下期分解!

Day 60 答案揭晓

DS Interview Questions

What are the advantages of random projection comparing to PCA?

With very high dimensions, if speed is an issue, then consider that on a matrix of size n×k, PCA takes O(k^2×n+k^3) time, whereas a random projection takes O(nkd), where you're projecting on a subspace of size d.


With a sparse matrix its even faster.


The data may well be low-dimensional, but not in a linear subspace. PCA assumes this.


Random projection are also quite fast for reducing the dimension of a mixture of Gaussians.


If the data is very large, you don't need to hold it in memory for a random projections, whereas for PCA you do.


In general PCA works well on relatively low dimensional data. Of course, PCA maintains the best possible projection.

BA Interview Questions

R language:

With, i

i

while(i<9){

 print(i)

 i=i+2

}



 长期招募 

TECHNICAL WRITER/翻译志愿者  

  1. 职责:

    1. 深度讨论数据应用

    2. 调研行业发展

  2. 要求:

    1. 对数据应用极为感兴趣

    2.  具备数据分析基础

    3. 具有一定BUSINESS INSIGHT

    4. 写作能力强

感兴趣的同学发送简历writing sample[email protected],邮件标题“申请翻译/Technical Writer”。




点击“阅读原文”查看数据应用学院核心课程