Наборы выборочных данных

Программное обеспечение Statistics and Machine Learning Toolbox™ включает наборы выборочных данных в следующую таблицу.

Чтобы загрузить набор данных в рабочую область MATLAB®, введите:

load filename

где filename один из перечисленных в таблице файлов.

Наборы данных содержат отдельные переменные данных, переменные описания со ссылками и массивы набора данных, инкапсулирующие набор данных и его описание, как соответствующие.

ФайлОписание набора данных
acetylene.matДанные о химической реакции с коррелироваными предикторами
arrhythmia.matСердечные данные об аритмии из репозитория машинного обучения UCI
carbig.matИзмерения автомобилей, 1970–1982
carsmall.matПодмножество carbig.mat. Измерения автомобилей, 1970, 1976, 1982
census1994.matВзрослые данные из репозитория машинного обучения UCI
cereal.matИнгредиенты блюда из хлопьев для завтрака
cities.matОценки качества жизни для американских территорий городов с пригородами
discrim.matВерсия cities.mat используемый для дискриминантного анализа
examgrades.matЭкзамен ранжирует по шкале 0–100
fisheriris.mat1 936 ирисовых данных Фишера
flu.matGoogle Flu Trends оценил ИЛИ (подобная гриппу болезнь) процент для различных областей США, и CDC взвесил процент ИЛИ на основе отчетов провайдера сигнальной метки
gas.matЦены на бензин вокруг Массачусетса в 1 993
hald.matТепло цемента по сравнению с соединением компонентов
hogg.matБактерии рассчитывают в различных поставках молока
hospital.matСимулированные данные больницы
humanactivity.matДанные о распознавании деятельности человека пяти действий: нахождение, положение, обход, выполнение и танец
imports-85.mat1 985 Автоматических Баз данных Импорта от репозитория UCI
ionosphere.matНабор данных Ionosphere от репозитория машинного обучения UCI
kmeansdata.matЧетырехмерные кластеризованные данные
lawdata.matСредний балл и баллы LSAT из 15 юридических школ
mileage.matДанные о пробеге для трех моделей автомобилей от двух фабрик
moore.matБиохимический спрос на кислород на пять предикторов
morse.matРаспознавание различий Кода Морзе некодерами
nlpdata.matДанные об обработке естественного языка извлечены из документации MathWorks®
ovariancancer.matСгруппированные наблюдения относительно 4 000 предикторов [1][2]
parts.matРазмерный выход на 36 круговых частях
polydata.matВыборочные данные для полиномиального подбора кривой
popcorn.matВыражение попкорна типом кнопки и брендом
reaction.matКинетика реакции для модели Хоуджен-Уотсона
spectra.matСпектры NIR и октановые числа 60 выборок бензина
stockreturns.matСимулированный запас возвращается

Ссылки

[1] Conrads, Томас П., Винсент А. Фусаро, Салли Росс, Дон Иоганн, Винодх Раджапаксе, Бен А. Хитт, Сет М. Стайнберг, и др. "Сыворотка с высоким разрешением Протеомные Функции Диагностики Рака яичника". Эндокринно-связанный Рак 11 (2004): 163–78.

[2] Petricoin, Эмануэль Ф., Али М. Ардекэни, Бен А. Хитт, Питер Дж. Левин, Винсент А. Фусаро, Сет М. Стайнберг, Гордон Б. Миллз, и др. “Использование Протеомных Шаблонов в Сыворотке, чтобы Идентифицировать Рак яичника”. The Lancet 359, № 9306 (февраль 2002): 572–77.