Conheça nosso site: portaldatascience.com
36 2
Quantas dessas habilidades você possui?
132 3
Você sabia? . Uma das partes mais interessantes sobre isso para mim é que eles usaram muitas bibliotecas Python para fazer essa mágica ... Aqui está a lista de bibliotecas que eles mencionaram em seu trabalho de pesquisa. Numpy SciPy. Pandas e Jupyter. Matplotlib Astropy
94 1
Como a ciência de dados se difere da ciência da computação? . A ciência de dados abrange a incerteza e a aproximação como conceitos primários. Para ambos, utiliza modelagem de probabilidade para formulação e raciocínio matemáticos. Em contraste, as fundações da ciência da computação se encaixam perfeitamente na lógica simbólica; grande parte da computação depende da abstração de tensões para bits. No arcabouço lógico da ciência da computação, a incerteza é tradicionalmente representada como não-determinismo. Essa distinção é uma simplificação grosseira da ciência da computação, já que muitas subáreas da computação usam o raciocínio probabilístico, mas muitas vezes esses enquadramentos probabilísticos são construídos como andaimes sobre seus elementos discretos e lógicos. Pensar como um cientista da computação, mas com a perspectiva de um cientista de dados, nos leva além do discreto, combinatório e exato.
45 1
A validação cruzada é uma técnica para avaliar a capacidade de generalização de um modelo, a partir de um conjunto de dados. Esta técnica é amplamente empregada em problemas onde o objetivo da modelagem é a predição. Busca-se então estimar o quão preciso é este modelo na prática, ou seja, o seu desempenho para um novo conjunto de dados. O conceito central das técnicas de validação cruzada é o particionamento do conjunto de dados em subconjuntos mutualmente exclusivos, e posteriormente, utiliza-se alguns destes subconjuntos para a estimação dos parâmetros do modelo (dados de treinamento) e o restante dos subconjuntos (dados de validação ou de teste) são empregados na validação do modelo. Diversas formas de realizar o particionamento dos dados foram sugeridas, sendo as três mais utilizadas: o método holdout, o k-fold e o leave-one-out
62 4
Visite nosso site: portaldatascience.com
99 4
Se liga!!
35 4